В этой заметке я расскажу как добывать уникальный контент для сайта – если нет ни денег, ни желания искать копирайтеров или писать самому. Мы коснемся некоторых интересных способов добычи контента.
Оцифровка печатных изданий и перевод в текст
Нужно будет обзавестись нормальным сканером и программой ABBY Fine Reader. Можно например сходить в библиотеку и набрать разных интересных книг, журналов, газет. Отсканируйте их, оцифруйте – и получите много разного контента. У кого такой возможности нет – просто скачайте уже готовые оцифрованные архивы печатных изданий на торрент-трекерах.
Пример ru и ua торрентов, где я обычно ищу и нахожу разную литературу в больших объемах:
- https://rutracker.org
- https://toloka.to
Парсинг сайтов из Вебархива
Довольно не стандартный подход. Суть заключается в том, чтобы найти в Webarchive сайты нужной тематики, которые на сегодняшний день больше не существуют (их никто не продлил, так-называемые дропы), но они когда-то содержали уникальный контент. Их и будем использовать в качестве источника материалов на сайте.
Весь процесс выглядит так:
- Поиск сайтов в Вебархиве по ключевому слову;
- Проверка доступности домена;
- Выгрузка сайта из Вебархива.
Перевод аудио в текст
Еще один метод, которым часто пользуются журналисты-интервьюверы. Конечно, они не набирают вручную текст, а используют специальные онлайн-сервисы или софт. Рассмотрим бесплатные:
- https://dictation.io/speech – нормально переводит простую речь в текст;
- https://speechlogger.appspot.com/ru/ – добротно переводит речь на русском в текст, мне понравилось. Остальные языки тоже поддерживаются, но не пробовал;
- https://speechpad.ru – поддерживает русский, украинский, армянский, грузинский и другие иностранные языки. Достаточно качественно переводит обычную человеческую речь в текст;
- https://docs.google.com – в Google Документах во вкладке Инструменты есть Голосовой набор, но я честно пока не очень доволен им.
Знаете другие методы? Напишите, пожалуйста, в комментариях!