ребят, не стал создавать новую тему...
вопрос такой: файл должен быть в кодировке ascii 8 bits windows cyrillic
как мне правильно сохранить файл в этой кодировке? у меня сохранение делается так:
StringList.SaveToFile(ExtractFilePath(Application. ExeName)+'\user.userdico');
Это он в какой кодировке сохраняет?
Как сделать нужное мне сохранение, подробно подскажите кодом, пожалуйста, если возможно!
что изменил в программе:
теперь конвертируется, и правильно ставятся части речи в получаемом файле
убираются знаки #, которые ставятся перед фонемой в словаре txt экспортом из редактора лексиконов...
спросил у разработчика формат файла dic лексикона, чтобы напрямую конвертировать лексиконы, так как их редактор очень долго их грузит. процедура может затянуться до часа...
и следом вопрос: при удалении дубликатов строк встроенным способом TStringList он удаляет полные дубликаты, где все строки совпадают полностью.
Но если вдруг в словарях два слова с разными фонемами? Причём само слово одинаковое. Хочу оставлять слово, добавленное из последнего словаря по счёту. Как это проще сделать без перебора встроенными методами? Или всё же без перебора не обойтись?
|