Идеи Archives

Category Archives: Бизнес идеи

Количество офисных зданий в городах постепенно увеличивается. Соответственно увеличивается и число офисных работников. Однако немногие из таких зданий имеют в своем распоряжении детский сад, который существенно облегчает положение бизнес-леди.

Многие мечтают иметь собственный бизнес. Однако, неизвестность и отсутствие информации часто создают препятствия на пути к реализации своей мечты. В данной статье покажем, что стать владельцем своего бизнеса не так уж и сложно, и разберемся с тем, какие действия необходимо предпринять для этого.

Если человек отлично разбирается в технике, то он всегда сможет найти себе нормальную работу. Также с помощью таких знаний можно даже построить собственный доходный бизнес.

Активная торговля этими лесными красавицами длится всего лишь около десяти дней. Однако стоит заметить, что расторопные предприниматели успевают заработать за такой незначительный промежуток времени вполне хорошие деньги – порядка 3000 долларов. Новогодняя ёлка относится к числу товаров, которые портятся очень быстро. Поэтому нужно приложить максимум усилий, чтобы успеть реализовать весь имеющийся запас в установленные сроки.

В последнее время наряду с традиционными хомяками, кроликами, собаками и кошками большую популярность получило разведение шиншилл в домашних условиях, данный бизнес уже успел завоевать обширную аудиторию.

Каждый второй желает открыть свое дело и работать лишь на самого себя. В связи с этим встает вполне резонный вопрос, какой бизнес без вложений принесет максимум прибыли и станет основным источником дохода. Ведь зачастую большинство не имеет в запасе лишней пары миллионов на свободное инвестирование.

Для многих, кто решил открыть собственный бизнес, камнем преткновения является именно финансовая сторона вопроса. Одни просто боятся рисковать большими суммами, другие не имеют необходимых средств на реализацию своих бизнес идей, а третьи специально подбирают бизнес идеи без вложений, хотя и имеют неплохое финансовое положение.

Сегодня каждая женщина хочет достойно зарабатывать и при этом не быть похожей на белку в колесе. Но как совместить работу с воспитанием детей и домашними обязанностями, а еще успеть пожить для себя? Все просто!

Вы привязаны к дому необходимостью ухаживать за маленьким или, наоборот, старым человеком. А может есть другая причина, но, главное, у вас есть время и это время хочется использовать для какого-нибудь интересного дела, которое ещё и деньги приносит. Вы начинаете с того, что вбиваете в поисковик фразу – домашний бизнес для женщин.

С каждым днем число желающих начать собственный бизнес неумолимо растет. Каждому хочется чувствовать себя хозяином жизни и не выслушивать упреки от начальника. И это хорошее желание, ведь есть масса способов открытия бизнеса при минимальных затратах. Далее мы предлагаем список бизнес идей с минимальными вложениями.

Справочная: “Архив Интернета” — история создания, миссия и дочерние проекты

Вероятно, на Хабре не так много пользователей, кто никогда не слышал об «Архиве Интернета» (Internet Archive), сервисе, который занимается поиском и сохранением важных для всего человечества цифровых данных, будь то интернет-странички, книги, видео или информация иного типа.

Кто управляет Интернет-архивом, когда он появился и какова его миссия? Об этом читайте в сегодняшней «Справочной».

Зачем вообще нужен «Архив»?

Это далеко не только развлечение. Миссия организации — всеобщий доступ ко всей информации. «Интернет-архив» стремится бороться с монополией на предоставление информации со стороны как телекоммуникационных компаний (Google, Facebook и т.п.), так и государств.

При этом «Архив» является законопослушной организацией. Если по закону США какую-то информацию необходимо удалить, организация это делает.

«Архив Интернета» также служит инструментом работы ученых, спецслужб, историков (например, археографов) и представителей многих других сфер, не говоря уже об отдельных пользователях.

Когда появился «Интернет-архив»?

Создатель «Архива» — американец Брюстер Кейл, который создал компанию Alexa Internet. Оба его сервиса стали чрезвычайно популярными, оба они процветают и сейчас.

«Интернет-архив» начал архивировать информацию с сайтов и хранить копии веб-страниц, начиная с 1996 года. Штаб-квартира этой некоммерческой организации располагается в Сан-Франциско, США.

Правда, в течение пяти лет данные были недоступны для общего доступа — данные хранились на серверах «Архива», и это все, просмотреть старые копии сайтов могла лишь администрация сервиса. С 2001 года администрация сервиса решила предоставить доступ к сохраненным данным всем желающим.

В самом начале «Интернет-архив» был лишь веб-архивом, но затем организация начала сохранять книги, аудио, движущиеся изображения, ПО. Сейчас «Интернет-архив» выступает хранилищем для фотографий и других изображений НАСА, текстов Open Library и т.п.

На что существует организация?

«Архив» существует на добровольные пожертвования — как организаций, так и частных лиц. Можно предоставить поддержку и в биткоинах, кошелек 1Archive1n2C579dMsAu3iC6tWzuQJz8dN. Этот кошелек, кстати, за все время существования получил 357.47245492 BTC, это примерно $2,25 миллиона по текущему курсу.

Как работает «Архив»?

Большинство сотрудников заняты в центрах по сканированию книг, выполняя рутинную, но достаточно трудоемкую работу. У организации три дата-центра, расположенных в Калифорнии, США. Один — в Сан-Франциско, второй — Редвуд Сити, третий — Ричмонде. Для того, чтобы избежать опасности потери данных в случае природной катастрофы или других катаклизмов, у «Архива» есть запасные мощности в Египте и Амстердаме.

«Миллионы людей потратили массу времени и усилий, чтобы разделить с другими то, что мы знаем в виде интернета. Мы хотим создать библиотеку для этой новой платформы для публикаций», — заявил основатель Архива интернета Брюстер Кале (Brewster Kahle)

Насколько велик сейчас “Архив”?

У «Интернет-архива» есть несколько подразделений, и у того, которое занимается сбором информации с сайтов, есть собственное название — Wayback Machine. На момент написания «Справочной» в архиве хранилось 339 миллиардов сохраненных веб-страниц. В 2017 году в «Архиве» хранилось 30 петабайт информации, это примерно 300 млрд веб-страниц, 12 млн книг, 4 млн аудиозаписей, 3,3 млн видеороликов, 1,5 млн фотографий и 170 тыс. различных дистрибутивов ПО. Всего за год сервис заметно «прибавил в весе», теперь «Архив» хранит 339 млрд веб-страниц, 19 млн книг, 4,5 млн видеофайлов, 4,7 млн аудиофайлов, 3,2 млн изображений разного рода, 381 тыс. дистрибутивов ПО.

Как организовано хранение данных?

Информация хранится на жестких дисках в так называемых «дата-нодах». Это серверы, каждый из которых содержит 36 жестких дисков (плюс два диска с операционными системами). Дата-ноды группируются в массивы по 10 машин и представляют собой кластерное хранилище. В 2016 году «Архив» использовал 8-терабайтными HDD, сейчас ситуация примерно такая же. Получается, что одна нода вмещает около 288 терабайт данных. В целом, еще используются жесткие диски и других размеров: 2, 3 и 4 ТБ.

В 2016 году жестких дисков было около 20 000. Дата-центры «Архива» оснащены климатическими установками для поддержания микроклимата с постоянными характеристиками. Одно кластерное хранилище из 10 нод потребляет около 5 кВт энергии.

Структура Internet Archive представляет собой виртуальную «библиотеку», которая поделена на такие секции, как книги, фильмы, музыка и т.п. Для каждого элемента есть описание, внесенное в каталог — обычно это название, имя автора и дополнительная информация. С технической точки зрения элементы структурированы и находятся в Linux-директориях.

Общий объем данных, хранимых «Архивом» составляет 22 ПБ, при этом сейчас есть место еще для 22 ПБ. «Потому, что мы параноики», — говорят представители сервиса.

Посмотрите на скриншот содержимого директории — там есть файл с названием, оканчивающимся на “_files.xml”. Это каталог с информацией обо всех файлах директории.

Что будет с данными, если выйдет из строя один или несколько серверов?

Ничего страшного не произойдет — данные дублируются. Как только в библиотеке «Архива» появляется новый элемент, он тут же реплицируется и размещается на различных жестких дисках на разных серверах. Процесс «зеркалирования» контента помогает справиться с проблемами вроде отключения электричества и сбоях в файловой системе.

Если выходит из строя жесткий диск, его заменяют на новый. Благодаря зеркалируемой и редуплицируемой структуре данных новичок сразу же заполняется данными, которые находились на старом HDD, вышедшем из строя.

У «Архива» есть специализированная система, которая отслеживает состояние HDD. В день приходится заменять 6-7 вышедших из строя накопителей.

Что такое Wayback Machine?

Это лишь один из сервисов «Интернет-архива», который специализируется на сохранении веб-страниц. У сервиса есть собственный «паук», который регулярно обследует все доступные в сети сайты и сохраняет их на специализированных серверах. Чем популярнее веб-сайт, тем чаще робот копирует его содержимое. Если администратор ресурса не желает, чтобы информация сайта копировалась ботом, достаточно прописать запрет в файле robots.txt.

Будет полезно:  Как красить жалюзийные двери?


Популярные ресурсы копируются часто — практически ежедневно. Wayback Machine индексирует даже социальные сети, включая Twitter, Facebook

В 2017 году «Архив» запустил обновленный сервис Wayback Machine, пообещав более удобный доступ к сохраненным веб-страницам. Сервис был написан если не с нуля, то здорово переработан. Теперь он поддерживает ряд форматов файлов, которые ранее просто не сохранялись В том же 2017 году организация заявила, что каждую неделю ее сервера сохраняют около 1 млрд веб-страниц.


Так выглядел Twitter в 2007 году

Что еще можно найти в базе «Интернет-архива»?

Книги. Коллекция организации огромна, она включает оцифрованные книги, как распространенные, так и очень редкие издания. Книги сохраняются не только англоязычные, но и на многих других языках. У «Архива» есть специализированные центры по сканированию книг, всего таких центров 33, расположены они в пяти странах по всему миру.

В день сотрудники центров сканируют около 1000 книг. В базе сервиса содержатся миллионы изданий, работа по их оцифровке финансируется как обычными людьми, так и различными организациями, включая библиотеки и фонды.

С 2007 года «Интернет-архив» сохраняет в своей базе общедоступные книги из Google Book Search. После запуска, база книг быстро разрослась — в 2013 году насчитывалось уже более 900 тысяч книг, сохраненных из сервиса Google.

Один из сервисов «Архива» также предоставляет доступ к книгам, которые полностью открыты, таковых насчитывается уже более миллиона. Называется этот сервис Open Library.

Видео. Сервис хранит 4,5 млн роликов. Они разбиты по тематикам и имеют самую разную направленность. На серверах «Архива» хранятся фильмы, документальные фильмы, записи спортивных соревнований, ТВ-шоу и многие другие материалы.

В 2015 году «Архив» дал начало масштабному проекту — оцифровке видеокассет. Сначала речь шла о 40 тысячах кассет из архива Мэрион Стоукс, женщины, которая в течение многих десятилетий записывала на кассеты новости. Затем добавились и другие видеокассеты, которые присылали «Архиву» поклонники идеи оцифровки данных, важных для человечества.

Аудио. Аналогично видео, «Архив» хранит и аудиофайлы, которые также разбиты по тематикам. В прошлом году «Архив» начал реализовывать свой новый проект — расшифровку шеллачных пластинок, старейшего формата аудиозаписей. Звук сохранялся на пластинках из шеллака — природной смолы, которую выделяют самками червецов. Всего в архиве Great 78 Project несколько сотен тысяч пластинок.

Программное обеспечение. Конечно, хранить все созданное человечеством ПО просто невозможно, даже для «Архива». На серверах хранится винтаж — например, программы для Macintosh, ПО под DOS и прочий софт. В 2016 году сотрудники «Архива» выложили 1500+ программ под Windows 3.1, работать можно прямо в браузере. В 2017 Internet Archive выпустил архив софта для первых Macintosh.

Игры. Да, «Архив» предоставляет доступ к огромному количеству игр. В некоторые из них можно поиграть в среде браузерного эмулятора. Игры хранятся самые разные, в том числе, и с портативных аналогово-цифровых приставок. Есть игры под MS-DOS и консольные игры для Atari и ColecoVision.

Впервые архив старых игр организация выложила еще в 2013 году. Речь идет о тайтлах 30–40 летней давности, в которые можно было играть прямо в браузере. Это игры для приставок Atari 2600 (1977 года выпуска), Atari 7800 (1986 г.), ColecoVision (1982 г.), Philips Videopac G7000 (1978 г.) и Astrocade (1983 г.). Самое интересное, что Internet Archive добился того, что играть можно вполне легально. Сейчас коллекция насчитывает уже более 3400 игр и продолжает пополняться.

Идеи Archives

Краткое описание:
Создай архив домашних документов – всего за 3 шага.

Описание:
Документы — неотъемлемая часть жизни каждого человека. Начинается она со свидетельства о рождении, потом следуют ученические билеты и абонементы в библиотеку, а спустя несколько лет — и более серьёзные бумажки. В конечном итоге каждый из нас владеет огромным набором удостоверений, страховых полисов и многого другого. Иметь всё это под рукой в электронном виде поможет приложение «Домашний архив». Его главные преимущества: поддержка функции сканирования документов, возможность их отправки подходящим способом, а также шифрование по алгоритму AES-128.

В Вашем распоряжении:

• большой выбор объектов – взрослые, дети, авто, недвижимость, животные и т.д.;
• индивидуальные наборы документов уже заложены в программу;
• встроенный сканер с фильтрами для документов;
• облачное или локальное хранение архива;
• синхронизация архива между Вашими устройствами через общий аккаунт;
• режим «Экспресс» – сканируйте документы в один клик в папку «Неразобранное»;
• быстрая отправка документов любым привычным способом;
• надежная система шифрования документов – AES-128;
• и многие другие полезные функции.

После установки приложения в меню появятся два ярлыка. Первый — само приложение, а второй отвечает за функцию экспресс-сканирования. Она создана, чтобы сканировать документы в один клик.

Согласно утверждению разработчиков, разобраться в функциях программы сможет даже ребёнок. И тратить время на знакомство с инструкцией не понадобится.

После нажатия на иконку «Домашнего архива» пользователю следует указать место хранения документов. Они могут находиться в Google Drive или же в памяти смартфона. Вне зависимости от выбора понадобится создать пароль и подсказку к нему.

По окончании подготовительного процесса владелец смартфона попадёт в «Архив» — главное меню. По сути это перечень документов, которые можно добавить. Здесь есть три предустановленных категории (объекта) — «Взрослый», «Машина» и «Ребёнок». Их можно переименовать, можно добавить и свои категории. Для каждого из этих объектов будет предложен свой набор документов. Для взрослых — паспорт, ИНН, СНИЛС и так далее, для ребёнка — свидетельство о рождении и расписание уроков, а для автомобиля — ПТС и страховка. Список документов можно увеличить, нажав на зелёную иконку плюса.

Следующий этап — добавление своих документов. Сделать это можно двумя способами: сканируя их фотокамерой или же просто добавляя уже сделанные снимки из галереи. После завершения процесса сканирования документы окажутся в архиве. Если пользователь воспользуется функцией сканирования в один клик, документы попадут в папку «Неразобранное». При наличии свободного времени с ними следует разобраться: ненужные файлы удалить, а подходящие — добавить в архив.

Хранить документы в «Домашнем архиве» очень удобно. Пользователю достаточно указать свои «объекты», и программа самостоятельно определит набор документов для каждого из них. В роли объектов могут выступать взрослые, дети, автомобиль, домашние животные и недвижимость. Размеры и пропорции всех документов соответствуют оригиналам согласно ГОСТ.

Безопасно ли хранить документы внутри программы? Да. Приложение использует алгоритм шифрования AES-128, а потому беспокоиться о попадании файлов в чужие руки незачем. Для увеличения производительности эту функцию можно отключить.

Наконец, программа умеет отправлять документы при помощи разнообразных коммуникационных приложений. Отправка осуществляется в двух форматах: PDF предназначен для одно- и многостраничных документов, тогда как JPG создан для отдельных страниц.

Приложение может служить единым архивом для нескольких пользователей. Достаточно использовать один Google-аккаунт и поставить соответствующую галочку при первом запуске.

Приложение распространяется бесплатно, однако в нём есть встроенные покупки — пакеты для увеличения количества хранимых документов или разблокировка премиум-версии. В последней нет никаких ограничений.

«Домашний архив» — надёжное хранилище ваших документов с возможностью их сканирования и отправки. Благодаря такому сочетанию всё самое важное будет всегда под рукой.

Требуется Android: 4.0.3+
Русский интерфейс: Да

Tag Archives идеи

Удалённая работа, часть 2

Ещё немного вакансий для тех, кто не хочет ничего бросать в жизни, но хочет что-то поменять, жить в тёплой стране, есть фрукты и пить копеечные смузи в обед 🙂
.
Начало в предыдущей записи. Продолжу список:
.
7. Обработка фото.
Разбираетесь в фотошопе или лайтруме? Задания на ретушь фото на биржах по удалённой работе есть всегда. Также можно работать удалённым ассистентом фотографа.
.
8. Работа с Microsoft Office.
Иногда размещаются задания на создание презентаций, редактирование или заполнение Excel-таблиц, приведение в красивый вид word-документов и т.д.
.
9. Наполнение сайтов товарами и описаниями.
Примитивная работа — скопировать и вставить. И так много-много часов подряд.
.
10. Размещение объявлений.
Примерно, как предыдущий вариант, только на сайтах типа Avito и прочих. Вам дают доступ к аккаунту и текст объявлений, а вы их размещаете.
.
11. Поиск информации и картинок.
Есть запрос на много-много картинок — вы ищите, сохраняете (или покупаете), отправляете.
.
12. Журналист.
Написание статей, текстов, репортажей, новостей для различных журналов и газет. Идеально сочетается с путешествиями.
.
13. Редактор сайта.
Сбор и подготовка материалов для статей, поиск и развитие новых тем, поиск авторов, проверка качества поступающих материалов от авторов и их редактирование, размещение статей на сайте, подбор картинок, работа с отзывами/комментариями.
.
14. Ну и на сладкое…
Тестер игр (или программ).
Да, можно играть в игры и получать за это деньги 🙂 или пользоваться программой/приложением. Нужно фиксировать все ошибки, несоответствия, некрасивости и писать отчёты об этом.
.
Все эти вакансии (*кроме последней) не очень увлекательные, да. Работа, как правило, нудная и долгая. Зато можно в бунгало у моря это делать 🙂
.
Пока всё.
Может соберу потом ещё один-два списка, потому что это далеко не всё. Ну и, делайте поправку на то, что в этом списке, так скажем, простые профессии — начать можно с минимумом или вообще без опыта и знаний. И всё же я знаю людей, которые живут в путешествиях именно за счёт такой работы.
.
Что думаете о таких профессиях? 🙂 Нашли что-то для себя?
.
P.S.:
Фото снова с острова Панган, боттл бич.

Будет полезно:  Чем пропитать разделочную доску из дерева?

Share this article

Удалённая работа, часть 1

Как зарабатывать, чтобы так путешествовать?!
.
Один из самых популярных вопросов в комментариях. И, наверное, каждый второй в директ.
Чтобы путешествовать не по 1-2 недели в году, а месяцами и сезонами, то зарабатывать желательно в интернете.
И я не буду оригинальным и расскажу о банальных и доступных каждому вариантах дистанционной работы.
.
Следующие профессии могут быть отличным началом, если вы «ничего не умеете» или «не знаете, что можно делать в интернете»:
.
1. Транскрибация.
Распознавание и набор текста из аудио и видео в текст. Например, чьи-то интервью, лекции или тренинги.
Слушаете запись и печатаете. Что может быть проще и понятнее? Чем быстрее печатаете, тем быстрее и больше заработаете.
.
2. Копирайтинг и рерайтинг.
Копирайтинг — это умение красиво и вкусно описать что-то, а рерайтинг — это передача чужого текста другими словами. Это прям постоянно нужно интернет-магазинам и контент-сайтам.
.
3. Звонки.
Это обзвон клиентов (или потенциальных клиентов) с помощью Skype или других программ ip-телефонии. Вам дают базу номеров, дают программу, дают скрипт — вы звоните и либо опрашиваете, либо продаёте что-то, либо проводите собеседования.
.
4. Переводы с ин.языков.
Многие думают, что для этого нужно быть переводчиком. Но нет. Очень часто достаточно базового уровня иностранного языка, умения пользоваться гугл переводчиком, и немножко мозгов, чтобы грамотно и литературно корректировать ошибки автоперевода. Некоторым сайтам нужно много контента, а он всегда есть на английском. Иногда это банальные статьи о новых шмотках, косметике и прочая ерунда — их очень легко переводить. И для подобных сайтов 100% точность переводов не важна.
.
5. Ведение группы в соцсетях.
Это прям хит! 🙂 Самая банальщина, но часто хорошо оплачивается.
Размещение записей в группах по графику, ответы на вопросы и удаление спама.
.
6. Модератор контента в соц.сетях.
Всем соцсетям (ВКонтакте и Одноклассники точно) нужно проверять добавляемые пользователями файлы на соответствие авторским правам и удалять «запретное». Платят не прям ах, но хватит, чтобы жить на острове.
.
В следующей части опишу ещё 6 таких профессий 🙂
.
P.S.:
Фото с острова Панган в Тайланде.

Share this article

Привет, завистники!

Ну что, завистники? Кто там мне писал, что я просто копирую у других? 🙂

Не прошло и недели — скопировали целый формат!

Меньше недели и…встречайте формат блиц-распродаж в других блогах! :))) Оперативность зашкаливает)

И ещё, ненавистники, расскажите мне, где были ваши кумиры в 2011 году, когда я уже публиковал распродажи? Упс… их ещё не было 🙂

А всем хорошим людям, которые читают мой блог и/или подписаны на него — ДОБРА!

Улыбок и добра. И много всего позитивного в жизни!

Пусть у вас всё будет хорошо. И пусть у вас будет много шикарных путешествий! 😉

Share this article

Самолёт с прозрачным дном

Предлагаю вам оценить душещипательный концепт самолёта от авиакомпании Virgin 🙂

Оцените задумку и идею сумасшедшего бизнесмена для сумасшедших путешественников!

Share this article

Аристон

Я путешественник и сейчас тестирую новый дизайн своего сайта 🙂 Прошу прощения за треш и угар происходящий сейчас на сайте 🙂

Webarchive — веб-архив всего интернета и сайтов или машина времени на archive.org

Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Не так давно я писал про то, что такое народная энциклопедия Википедия, которая безусловно заслуживает всяких лестных эпитетов, несмотря на присущие ей небольшие недостатки и критику ее статей со стороны научного сообщества.

Сам факт того, что некоммерческий проект уже не одно десятилетие трудится на благо всего интернет сообщества, заслуживает огромного уважения. Но в сети есть еще подобный масштабный проект, который не получая с этого дохода выполняет очень важную роль — сохраняет архивы сайтов, видео, аудио и печатной продукции.

Я говорю, конечно же, про web.archive.org — глобальный проект с казалось бы невыполнимой миссией — создание архива всех сайтов, когда либо размещенных в интернете. Причем, сайты сохраняются не в виде скриншотов, а в виде полноценно работающих веб-страниц со всеми ссылками, картинками и стилевым оформлением (CSS). Причем, для каждого сайта за время его существования в сети в этом архиве может накопиться и по несколько сотен копий, датированных разными этапами жизни ресурса.

Как можно использовать архив сайтов интернета

Чем же может быть полезен данный webarchive?

  1. Ну, во-первых, вы можете погрузиться в приятную ностальгию путешествуя по вашему сайту многолетней давности. Проследить историю изменений можно будет для любого другого ресурса интернета (например, я брал скриншоты для статей про уже умерший Апорт именно из это вебархива, да и скриншоты, иллюстрирующие эволюцию главной страницы Яндекса, имеют тоже самое происхождение).
  2. Но это не все. Если страница добавленного вами в закладки сайта не открывается, то вы, конечно же, можете попробовать вытащить ее из кеша Яндекса или Гугла (читайте подробнее про то, как лучше искать в Google). Но если ресурс недоступен уже очень давно, то такие мертвые ссылки нигде кроме archive.org открыть уже будет не возможно (правда, и там его может не оказаться по описанным чуть ниже причинам).
  3. Так же, если вы по каким-либо форс-мажорным обстоятельствам не делали бэкап (резервное копирование) вашего сайта, то данный web archive будет единственной возможностью восстановить свой сайт. Имеется возможность очистить все ссылки от привязки к web.archive.org и сделать их прямыми именно для вашего ресурса (читайте об этом ниже).

Ну, и последнее, что приходит в голову — поиск уникального контента. Если вы не способны сами создавать уникальный контента для сайта (писать статьи), то здесь вы сможете ими разжиться, правда, усилия приложить все равно придется. Суть такова, что многие сайты умирают и становятся недоступны вместе с имеющимся на них контентом.

Отыскав такие ресурсы вы сможете вытащить тексты из интернет-архива и разместить их у себя, предварительно проверив их на уникальность. Таким образом вы не занимаетесь плагиатом и не нарушаете авторские права (копирайт), но искать в вебархиве многим может показаться очень уж трудоемкой задачей.

Онлайн сервис Webarchive ведет свою историю аж с 1996 года. Поставленная перед проектом задача казалась невыполнимой даже с учетом того, что сайтов на то время в интернете было значительно меньше, чем сейчас (на несколько порядков). По началу, сайты архивировались не очень часто, но со временем, повышая мощности хранилищ, Веб-архив стал делать все больше и больше слепков сайтов.

Сам себя этот веб архив занес в базу лишь в 1997 году и выглядела его главная страница тогда так:

Сейчас на все про все (включая аудио, видео и отсканированные книги) у этой некоммерческой организации задействовано дисковое пространство чудовищных размеров, измеряемое десяткой с пятнадцатью нулями байт. Сайт имеет зеркала в различных дата центрах, а сам проект с недавних пор получил официальный статус библиотеки. Если рассматривать только архив страниц сайтов, то их уже там насчитывается около ста миллиардов (тут учитываются все слепки страниц когда-либо снятые и сохраненные).

На главной странице доступен не только архив страниц интернета Wayback Machine, но и архивы различных кинохроник, телепередач, аудио записей и отсканированных в различных библиотеках книг:

Но нас интересует именно область WEB с логотипом Wayback Machine. В расположенную там форму можно ввести URL или доменное имя интересующего вас сайта (читайте про то, что такое домен и чем он отличается от URL), чтобы попасть на страницу с календарем:

Из приведенного примера видно, что мой блог был впервые архивирован 27 августа 2009 года (через пять дней после регистрации (покупки) домена ktonanovenkogo.ru). За прошедший интервал времени было создано 125 архивных копий сайта, каждую из которым можно будет посмотреть и потрогать руками (осуществляя переходы по внутренним ссылкам).

Открытие мертвых ссылок и условия попадания сайта в archive.org

В календаре голубыми кружочками отмечены даты, в которые был создан слепок (вебархив) данного сайта. Естественно, что моменты снятия слепка никак не будет коррелироваться с производимыми на вашем ресурсе изменениями, и их время Webarchive определяет строго исходя из своих внутренних алгоритмов и таймеров.

Поэтому использовать архив интернета, как инструмент для открытия временно недоступных сайтов, наверное, не всегда будет резонным. Для этого у Яндекса имеется возможность просмотра архивной копии документа:

Да, и в Google можно всегда посмотреть сохраненную копию веб-страницы:

Данный же онлайн сервис понадобится в особо тяжелых случаях, когда искомая страница уже не существует и вряд ли уже будет существовать в реальном интернете, но зато она по прежнему будет доступна в машине времени.

Правда, тут должно быть соблюдено несколько условий того, чтобы сайт попал в archive.org:

Он не должен содержать в своем файле robots.txt запрет для его индексации роботом с web.archive.org. Такой запрет, обычно выглядит так:

Когда я писал статью про электронную почту mail.ru, то не смог найти в Архиве Интернета сохраненных копий сайта mail.ru, т.к. его файл robots.txt содержал в себе похожий запрет:

  • Некоторые сайты Вебархив по каким-либо причинам банально не нашел. Вероятность попадания ресурса в базу повышается, если он будет добавлен в каталог Dmoz или же если на него будут проставлены ссылки с других популярных ресурсов, которые в Webarchive уже находятся. В общем то, даже простой запрос через форму на главной странице этого сервиса может послужить толчком к привлечению внимания этого архиватора к вашему ресурсу.
  • Как найти нужный веб-архив и восстановить сайт без бекапа

    По архивам можно перемещаться и с помощью временной шкалы расположенной вверху страницы, где вертикальными черными черточками отмечены имеющиеся для этого сайта слепки. Иногда, веб-архивы могут быть битыми, тогда придется открыть ближайший к нему слепок.

    Щелкнув по голубому кружочку мы можем увидеть ссылки на несколько архивов, отличающихся временем их снятия.

    Возможно, что это делается во избежании потери данных за счет неизбежной порчи жестких дисков в хранилищах. Перейдя к просмотру одного из веб-архивов, вы увидите копию своего (в данном примере моего) сайта с работающими внутренними ссылками и подключенным стилевым оформлением. Правда, не идеально работающим.

    Например, кое-что из дизайна у меня все же перекосило и боковое меню работающее на ДжаваСкрипте полностью исчезло:

    Но это не столь важно, ибо в исходном коде страницы с web.archive.org это меню, естественно, присутствует. Однако, просто так скопировать текст этой страницы к себе на сайт взамен утерянной не получится. Почему? Да потому что путешествие внутри сайта из прошлого будет возможно лишь в случае замены всех внутренних ссылок на те, что генерит Webarchive (в противном случае вас перебросило бы на современную версию ресурса).

    Выглядят эти ссылки примерно так:

    Понятно, что можно будет вручную отсечь вступительную часть ссылок ( http://web.archive.org/web/20111013120145/ ), получив таким образом рабочий вариант. Можно этот процесс даже автоматизировать с помощью инструмента поиска и замены редактора Notepad, но еще проще будет воспользоваться встроенной в этот сервис возможностью замены внутренних ссылок на оригинальные.

    Для этого копируете адрес страницы с нужным слепком вашего сайта (из адресной строки браузера — начинается с http://web.archive.org/ ). Он будет иметь примерно такой вид:

    И вставляете в него конструкцию «id_» в конце даты ( 20111013120145 ), чтобы получилось так:

    Теперь измененный адрес обратно возвращаете в адресную строку браузера и жмете на Enter. После этого страница c архивом вашего сайта обновится и все внутренние ссылки станут прямыми. Можно будет копировать текст статьи из исходного кода вебархива.

    Понятно, что восстановление таким образом огромного сайта займет чудовищное количество времени, но когда другого варианта нет, то и такой покажется манной небесной. К тому же, страдают невозвратной потерей контента обычно только начинающие вебмастера, у которых этого самого контента было мало, а более-менее опытные сайтовладельцы, уж не раз обжигавшиеся на подобных вещах, делают бэкапы файлов и базы по пять раз на дню.

    Если вы захотите увидеть все страницы вашего (или чужого) сайта, которые содержатся в недрах этого мастодонта, то вам нужно будет вставить в адресную строку браузера следующий адрес и нажать Enter:

    Вместо моего домена можно использовать свой. На открывшейся странице вы получите возможность наложить фильтр в предназначенной для этого форме:

    Например, я захотел увидеть лишь текстовые файлы своего блога, которые заглотил Web Archive. Зачем — не знаю, но захотел.

    Как вытянуть из Webarchive уникальный контент для сайта

    Описанный ниже способ лично я не использовал, но чисто теоретически все должно работать. Саму идею я почерпнул на этом молодом ресурсе, где и были описаны все шаги. Принцип метода состоит в том, что каждый день умирают и никогда не возрождаются десятки сайтов.

    Причин этому может быть много и большинство из почивших в бозе ресурсов никакой особой ценности в плане контента никогда и не представляли. Но из всякого правила бывают исключения и нужно будет всего-навсего отделить зерна от плевел. Главное чтобы исчезнувшие сайты с более-менее удобоваримым контентом были бы представлены в Web Archive, хотя бы одной копией.

    Т.к. после смерти контент этих сайтов постепенно выпадет из индекса поисковых систем, то взяв его из интернет-архива вы, по идее, станете его законным владельцем и первоисточником для поисковых систем. Замечательно, если будет именно так (есть вариант, что еще при жизни ресурса его нещадно могли откопипастить). Но кроме проблемы уникальности текстов, существует проблема их отыскания.

    Во-первых, нам нужен список сайтов, которые скоро умрут или уже померли. Автор метода предлагает скачать с сайта регистратора доменных имен Nic.ru список освобождающихся или уже освободившихся доменов.

    Что примечательно, в последней колонке этого списка (его можно открыть в Excel) будет отображаться количество архивов, созданных для каждого сайта в Web Archive (правда, проверить наличие домена в веб-архиве можно и в ряде онлайн сервисов).

    Список буржуйских доменных имен, освобождающихся или уже освободившихся, предлагается скачать по этой ссылке. Ну, а дальше просматриваем содержимое сайтов, которое сохранил Web Archive и пытаемся найти что-то стоящее. Потом проверяем уникальность этих материалов (ссылку приводил чуть выше) и в случае удачи публикуем их на своем ресурсе, либо продаем в какой-нибудь бирже контента.

    Да, способ муторный и мною лично не проверенный. Но, думаю, что при некоторой степени автоматизации и обмозговывания он может давать неплохой выхлоп. Наверное, кто-нибудь уже это поставил на поток. А вы как думаете?

    Ссылка на основную публикацию