Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > Разное
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 20.11.2010, 19:24
STL STL вне форума
Прохожий
 
Регистрация: 20.11.2010
Сообщения: 1
Репутация: 10
Восклицание Распознавание текста

Доброго времени суток, форумчане.
Задача следующая: Необходимо релизовать конечный автомат, который будет работать с текстом. Автомат разбирает текст на отдельные предложения и заносит их в базу. Затем уже в каждом предложении автомат должен выделить каждое слово и занести его в базу.
При этом всем если встречается сокращение вида "г."(либо (м/р ну и т.п.) то мы должны определить это слово как сокращение и занести в отдельную базу.
Хотелось бы услышать предложения по реализации подобного КА, т.е. алгоритмы выделения предложений, слов в них, принимая во внимание возможность наличия сокращений.
Ответить с цитированием
  #2  
Старый 29.11.2010, 11:03
eldaeron eldaeron вне форума
Прохожий
 
Регистрация: 05.05.2008
Сообщения: 15
Репутация: 10
По умолчанию

первое что приходит в голову, это посимвольно перебрать текст и разбить на предложения по точкам. естественно отдельно обрабатывать многоточие и другие возможные варианты использования точки в предложениях (те же сокращения "г." ).
затем каждое предложение разбить по пробелам.
потом все что получилось обработать по словарю ваших возможных сокращений.
но это все долго)
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 00:59.


 

Сайт

Форум

FAQ

Соглашения

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2025