Недавно добавленные исходники

•  DeLiKaTeS Tetris (Тетрис)  210

•  TDictionary Custom Sort  3 370

•  Fast Watermark Sources  3 123

•  3D Designer  4 881

•  Sik Screen Capture  3 382

•  Patch Maker  3 583

•  Айболит (remote control)  3 687

•  ListBox Drag & Drop  3 051

•  Доска для игры Реверси  81 982

•  Графические эффекты  3 981

•  Рисование по маске  3 282

•  Перетаскивание изображений  2 656

•  Canvas Drawing  2 793

•  Рисование Луны  2 611

•  Поворот изображения  2 225

•  Рисование стержней  2 180

•  Paint on Shape  1 583

•  Генератор кроссвордов  2 257

•  Головоломка Paletto  1 782

•  Теорема Монжа об окружностях  2 262

•  Пазл Numbrix  1 696

•  Заборы и коммивояжеры  2 069

•  Игра HIP  1 289

•  Игра Go (Го)  1 244

•  Симулятор лифта  1 486

•  Программа укладки плитки  1 228

•  Генератор лабиринта  1 560

•  Проверка числового ввода  1 377

•  HEX View  1 505

•  Физический маятник  1 364

 
скрыть


Delphi FAQ - Часто задаваемые вопросы

| Базы данных | Графика и Игры | Интернет и Сети | Компоненты и Классы | Мультимедиа |
| ОС и Железо | Программа и Интерфейс | Рабочий стол | Синтаксис | Технологии | Файловая система |



Delphi Sources

Еще раз о нечетком сравнении строк



Автор: Дмитрий Кузан

По мотивам обсуждения статьи Функция приблизительного (нечеткого) сравнения строк

Второй вариант поиска: compare1.zip (359 K)

Отличия от первого, по моим субъективным наблюдениям, в следующем:

1. Лучше находит похожие слова лежащие в одной плоскости
Соха - Сноха - совпадение 88 при том что в первом алгоритме составило 66 при длине фразы = 3
2. Хуже находит похожие (даже идентичные), но перевернутые слова
Тихий Дон - Дон Тихий - в первом способе совпадение 79 во втором 55 - очень существено.

Так что первый способ я рекомендовал для сравнения, например, полей двух баз данных.

Второй способ, по моему убеждению, лучше использовать в поиске по словарю или в тех местах, где надо найти фразу.

Вообще-то, существуют еще, кроме этих, алгоритмы поиска. Я бы выделил SoundEx для сравнения, но у него есть свои недостатки — он языкозависим, но отлично подходит для сравнения английских фраз.

Если вас это заинтересует то могу прислать в оригинале (написан он на C), но перевести в Pascal для людей которых это заинтересует, не составит труда.

И, напоследок, предлагаю вам архив с примерами алгоритмов анализа строк. К сожалению страницы указанные в архиве, как начальные, где можно найти информацию, не работают - поэтому высылаю слепок с сайта. Скачать stephen.zip (185 К)

На данных страницах лежит очень много алгоритмов касающихся анализа строк, приведу список причем очень хорошо документированных и математически обоснованных.

3. ОБЗОР АЛГОРИТМОВ
  • 3. 1 Сопоставления строк
  • 3. 2 Расстояния между строками
  • 3. 2.1 Обобщенные задачи
  • 3. 3 Нечеткое сопоставление строк
  • 3. 3.1 Специальные устройства
  • 3. 4 Максимальная повторяющаяся подстрока
4. АЛГОРИТМЫ
  • 4. 1 Поиск образцов
  • 4. 1.1 Наивный подход
  • 4. 1.2 Кнут-Моррис-Пратт
  • 4. 1.3 Бойер-Мур
  • 4. 1.4 Бойер-Мур-Хорспул
  • 4. 1.5 Сандей: Быстрый поиск, Максимальный сдвиг, Оптимальное несовпадение
  • 4. 1.6 Хьюм и Сандей. Улучшенные алгоритмы Бойера-Мура и Наименьшая цена
  • 4. 1.7 Харрисон
  • 4. 1.8 Карп-Рабин
  • 4. 2 Расстояние между строками и самая длинная общая подпоследовательность
  • 4. 2.1 Вагнер-Фишер
  • 4. 2.2 Хиршберг
  • 4. 2.3 Хант-Шиманский
  • 4. 2.4 Машек-Патерсон
  • 4. 2.5 Укконен
  • 4. 2.6 Самая тяжелая общая подпоследовательность
4. 3 НЕЧЕТКОЕ СОПОСТАВЛЕНИЕ СТРОК
  • 4. 3.1 k несовпадений - Ландау-Вишкин
  • 4. 3.2 k различий - Ландау-Вишкин
  • 4. 4 Самая длинная повторяющаяся подстрока
  • 4. 4.1 Наивный подход
  • 4. 4.2 Суффиксные деревья




Похожие по теме исходники

Нейросеть для распознавания образов

Разбиение файла на части




Copyright © 2004-2024 "Delphi Sources" by BrokenByte Software. Delphi World FAQ

Группа ВКонтакте