Прекрасная книга и притом единственная на русском языке, которая охватывает целый спектр современных инструментов для обработки неструктурированного текста, таких как Apache Tika и Apache Solr (он же Apache Lucene, свободный поисковик)
Umfang 416 seiten
2013 Jahr
Обработка неструктурированных текстов. Поиск, организация и манипулирование
Über das Buch
В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений.
Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.
Genres und Tags
Прекрасная книга! Одна из редких книг по NLP на русском. Всё расписано от отдельных алгоритмов до построения полноценной системы поиска. Одно жалко, что на Джаве. Но ничего, перепишу на Питон.
Hinterlassen Sie eine Bewertung
Bewertungen
2