![]() |
|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
Опции темы | Поиск в этой теме | Опции просмотра |
|
#1
|
|||
|
|||
![]() Добрый день. Есть функция выбора кодовой страницы
Код:
function FindCharSet(const Data:string):integer; const (*это в общем не нужно*) CodePages: array[0..10] of string = ('utf-8','utf-16','windows-1251','koi8-r','iso-8859-1', 'iso-8859-15','windows-1252','iso-8859-2','iso-8859-3','iso-8859-4','iso-8859-5'); var Pos1,Pos2:integer; CharSet:string; begin Pos1:=PosEx('charset=',Data,1); Pos2:=PosEx('>',Data,Pos1); CharSet:=Copy(Data, Pos1,(Pos2-Pos1+1)); (*выделяем чарсет из страницы*) if Pos1 > 0 then (*если чарсет есть тогда*) begin if True then (*если в чарсет нет указания на кодировку страницы, принудительно назначить 1251*) begin Result:=1251; end else (*когда номер страницы указан*) begin if PosEx('utf-8',CharSet,1) > 0 then Result:=65001; if PosEx('utf-16',CharSet,1) > 0 then Result:=65001; if PosEx('windows-1251',CharSet,1) > 0 then Result:=1251; if PosEx('windows-1252',CharSet,1) > 0 then Result:=1252; if PosEx('koi8-r',CharSet,1) > 0 then Result:=20866; if PosEx('iso-8859-1',CharSet,1) > 0 then Result:=28591; if PosEx('iso-8859-2',CharSet,1) > 0 then Result:=28592; if PosEx('iso-8859-3',CharSet,1) > 0 then Result:=28593; if PosEx('iso-8859-4',CharSet,1) > 0 then Result:=28594; if PosEx('iso-8859-5',CharSet,1) > 0 then Result:=28595; if PosEx('iso-8859-15',CharSet,1) > 0 then Result:=28605; end; end else (когда чарсета нет, присваиваем принудительно) begin Result:=1251; end; end; Внимание!! Вопрос: Как покороче написать if True then если использовать массив строк, то прийдется лепить излишне сложный код, поскольку есть варианты: charset=windows-1251" charset="windows-1251" charset='windows-1251' из этого нужно выделить windows-1251(к примеру) если помножить на число кодировок получается громоздко. нет ли какого фокуса чтоб написать покороче |
#2
|
|||
|
|||
![]() regexp? )))
|
#3
|
||||
|
||||
![]() завести 2 массива charset[]: String и codepage[]: Integer и через
Код:
function AnsiIndexText(const AText: string; const AValues: array of string): Integer; Пишу программы за еду. __________________ |
#4
|
||||
|
||||
![]() Ассоциативный контейнер.
Код:
codepage := list.indexof(переменная с текстом кодировки); if codepage = -1 then showmessage('неизвестная кодировка'); Цитата:
можно один TStrings к примеру. — Как тебя понимать? — Понимать меня не обязательно. Обязательно меня любить и кормить вовремя. На Delphi, увы, больше не программирую. Рекомендуемая литература по программированию |
#5
|
|||
|
|||
![]() это все хорошо, особенно про AnsiIndexText. все это уже используется
но чтоб это применить нужно точно выявить строку с указание кодировки, к примеру windows-1251, что не так то просто с учетом вариантов charset=windows-1251" charset="windows-1251" charset='windows-1251' как сделать простым код выделения указания кодировки, вот о чем вопрос |
#6
|
||||
|
||||
![]() Цитата:
Код:
Caption:=StringReplace(Caption, '''', '', [rfReplaceAll, rfIgnoreCase]); Caption:=StringReplace(Caption, '"', '', [rfReplaceAll, rfIgnoreCase]); Пишу программы за еду. __________________ |
#7
|
|||
|
|||
![]() немного сложнее, на самом деле
charset=windows-1251" charset="windows-1251" charset='windows-1251' или вообще charset=koi8-r" http-equiv="content-type" /> или еще длиннее может запустить цикл FOR с PosEX внутри и подстановкой в цикле значения кодировки из массива? если есть хоть одно совпадение, тогда ДА, если ни одного тогда НЕТ(это выход функции)??? или есть что по прямее, что то чего Я пока еще не знаю? |