![]() |
|
|
|||||||
| Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
|
Опции темы | Поиск в этой теме | Опции просмотра |
|
|
|
#1
|
|||
|
|||
|
Добрый день. Есть функция выбора кодовой страницы
Код:
function FindCharSet(const Data:string):integer;
const (*это в общем не нужно*)
CodePages: array[0..10] of string = ('utf-8','utf-16','windows-1251','koi8-r','iso-8859-1',
'iso-8859-15','windows-1252','iso-8859-2','iso-8859-3','iso-8859-4','iso-8859-5');
var Pos1,Pos2:integer; CharSet:string;
begin
Pos1:=PosEx('charset=',Data,1);
Pos2:=PosEx('>',Data,Pos1);
CharSet:=Copy(Data, Pos1,(Pos2-Pos1+1)); (*выделяем чарсет из страницы*)
if Pos1 > 0 then (*если чарсет есть тогда*)
begin
if True then (*если в чарсет нет указания на кодировку страницы, принудительно назначить 1251*)
begin
Result:=1251;
end
else (*когда номер страницы указан*)
begin
if PosEx('utf-8',CharSet,1) > 0 then Result:=65001;
if PosEx('utf-16',CharSet,1) > 0 then Result:=65001;
if PosEx('windows-1251',CharSet,1) > 0 then Result:=1251;
if PosEx('windows-1252',CharSet,1) > 0 then Result:=1252;
if PosEx('koi8-r',CharSet,1) > 0 then Result:=20866;
if PosEx('iso-8859-1',CharSet,1) > 0 then Result:=28591;
if PosEx('iso-8859-2',CharSet,1) > 0 then Result:=28592;
if PosEx('iso-8859-3',CharSet,1) > 0 then Result:=28593;
if PosEx('iso-8859-4',CharSet,1) > 0 then Result:=28594;
if PosEx('iso-8859-5',CharSet,1) > 0 then Result:=28595;
if PosEx('iso-8859-15',CharSet,1) > 0 then Result:=28605;
end;
end
else (когда чарсета нет, присваиваем принудительно)
begin
Result:=1251;
end;
end;Внимание!! Вопрос: Как покороче написать if True then если использовать массив строк, то прийдется лепить излишне сложный код, поскольку есть варианты: charset=windows-1251" charset="windows-1251" charset='windows-1251' из этого нужно выделить windows-1251(к примеру) если помножить на число кодировок получается громоздко. нет ли какого фокуса чтоб написать покороче |
|
#2
|
|||
|
|||
|
regexp? )))
|
|
#3
|
||||
|
||||
|
завести 2 массива charset[]: String и codepage[]: Integer и через
Код:
function AnsiIndexText(const AText: string; const AValues: array of string): Integer; |
|
#4
|
||||
|
||||
|
Ассоциативный контейнер.
Код:
codepage := list.indexof(переменная с текстом кодировки);
if codepage = -1 then
showmessage('неизвестная кодировка');Цитата:
можно один TStrings к примеру. |
|
#5
|
|||
|
|||
|
это все хорошо, особенно про AnsiIndexText. все это уже используется
но чтоб это применить нужно точно выявить строку с указание кодировки, к примеру windows-1251, что не так то просто с учетом вариантов charset=windows-1251" charset="windows-1251" charset='windows-1251' как сделать простым код выделения указания кодировки, вот о чем вопрос |
|
#6
|
||||
|
||||
|
Цитата:
Код:
Caption:=StringReplace(Caption, '''', '', [rfReplaceAll, rfIgnoreCase]); Caption:=StringReplace(Caption, '"', '', [rfReplaceAll, rfIgnoreCase]); |
|
#7
|
|||
|
|||
|
немного сложнее, на самом деле
charset=windows-1251" charset="windows-1251" charset='windows-1251' или вообще charset=koi8-r" http-equiv="content-type" /> или еще длиннее может запустить цикл FOR с PosEX внутри и подстановкой в цикле значения кодировки из массива? если есть хоть одно совпадение, тогда ДА, если ни одного тогда НЕТ(это выход функции)??? или есть что по прямее, что то чего Я пока еще не знаю? |