Голосов: 0
#1
Предлагаю свой скрипт написанный на Python 3, который обрабатывает текст, собранный парсером и сохраняет только качественные предложения, устраняя в них различные ошибки.
Скрипт работает аккуратно, сохраняя максимальное количество предложений. В очищенных текстах вы не найдете китайских иероглифов, знаков, изображающих кеды, смайликов и прочих ненужных символов, вы увидите только нормальный текст, знаки пунктуации и необходимые символы.
По окончании работы скрипт выводит сообщения о времени работы, первоначальном и конечном размерах всех обрабатываемых файлов.
Участники складчины получат скрипт на 920 строк (открытый код с комментариями), 3 словаря к нему (один словарь на 970 строк), двухстраничный документ, в котором описана установка интерпретатора Python, порядок работы со скриптом и словарями, бонус в виде 2 небольших полезных скриптов. Также я предлагаю настроенную портативную программу для написания/редактирования и выполнения кода.
Материал рассчитан на тех, кто никогда не писал скриптов и программ.
Я доволен качеством работы скрипта, предлагаю посмотреть 10 образцов обработанных текстов:
Может получиться так, что после обработки своих текстов вы обнаружите какие-то "дефекты", что-то вам не понравится. Я готов буду рассмотреть такие тексты и внести изменения в код в ходе обсуждения после закрытия складчины. Длительную поддержку не обещаю, но если будут пожелания со стороны складчиков, внесу изменения в код.
Для просмотра содержимого вам необходимо зарегистрироваться!Для просмотра содержимого вам необходимо зарегистрироваться!
Последнее редактирование модератором:
- Статус
- В этой теме нельзя размещать новые ответы.