Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > [ "Начинающим" ]
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 16.02.2013, 17:47
Pcrepair
 
Сообщения: n/a
По умолчанию Функция COPY. Быстродействие

Добрый день. Есть функция удаления подстроки типа <gg hhh>jjjj</gg> из строки
(на самом деле посимвольное копирование когда это не запрещено условием)

Код:
function DelUseless(const Data:string):string;
var
Len,I,EndTeg,Differ,J:integer;
DefineTeg:string; (*первые N символов после <*)
begin                  
Len:=Length(Data);
SetLength(Result, Len);
Differ:=0;
J:=0;
if Length(Data) = 0 then Exit else
for I := 1 to Length(Data) do
(*-----------------ЦИКЛ-----------------------------*)
 begin
   if Differ > 0 then Dec(Differ)
     else
      if (Data[i] = '<') then
        begin
          DefineTeg:=Copy(Data, I,10); (*тут тормоз?*)
             if (PosEx('<script', DefineTeg,1)= 0) then
               begin
                 Inc(J);
                 Result[J]:=Data[i];
               end
             else
               begin
                  EndTeg:=PosEx('</script>',Data,I);
                  if (EndTeg > 0) then Differ:=(EndTeg - I + 8);
               end
        end
   else
    begin
      Inc(J);
      Result[J]:=Data[i];
    end
 end;
(*-----------------конец-----------------------------*)
SetLength(Result, J);
end;  (*все работает*)

функция работает достаточно быстро (файл 3 мб за 30 мС обрабатывает)
но есть подозрение, что использование COPY (DefineTeg:=Copy(Data, I,10) увеличивает время обработки
Внимание!! Вопрос:
1. действительно ли COPY не самое лучшее решение по быстродействию
2. чем можно заменить COPY? может вставка на ASM?
Ответить с цитированием
  #2  
Старый 16.02.2013, 23:23
Snake22 Snake22 вне форума
Активный
 
Регистрация: 20.02.2011
Сообщения: 374
Репутация: 744
По умолчанию

а разве Copy уже не написана на асме?
не заморачивайся) 30мсек
Ответить с цитированием
  #3  
Старый 17.02.2013, 00:08
Аватар для Bargest
Bargest Bargest вне форума
Профессионал
 
Регистрация: 19.10.2010
Адрес: Москва
Сообщения: 2,390
Версия Delphi: XE3/VS12/FASM
Репутация: 14665
По умолчанию

Вообще не понимаю использования PosEx для сравнения строк.
__________________
jmp $ ; Happy End!
The Cake Is A Lie.
Ответить с цитированием
  #4  
Старый 17.02.2013, 10:26
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
По умолчанию

тут проблема не в Copy, а в алгоритме.
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
  #5  
Старый 17.02.2013, 11:17
Pcrepair
 
Сообщения: n/a
По умолчанию

Цитата:
Сообщение от Bargest
Вообще не понимаю использования PosEx для сравнения строк.

если можно поподробнее. ведь в букваре сказано:
функция для поиска в строке, именуемая PosEx.
Ответить с цитированием
  #6  
Старый 17.02.2013, 15:11
Аватар для Bargest
Bargest Bargest вне форума
Профессионал
 
Регистрация: 19.10.2010
Адрес: Москва
Сообщения: 2,390
Версия Delphi: XE3/VS12/FASM
Репутация: 14665
По умолчанию

Зачем искать в строке, когда можно просто сравнить строки на равенство? Копировать не 10 символов, а 7 (длина строки "<script"), а затем сравнить копированную строку со "<script" обычным "равно".
Вообще NumLock прав. Не понимаю этих плясок с бубном вокруг цикла for, когда гораздо быстрее было бы сделать while, на котором лишние итерации можно просто пропустить.
__________________
jmp $ ; Happy End!
The Cake Is A Lie.
Ответить с цитированием
  #7  
Старый 17.02.2013, 17:21
Pcrepair
 
Сообщения: n/a
По умолчанию

тут все немножко сложнее, сейчас функция уже имеет вид
Код:
function DelUseless(const Data:string):string;
 
const
Teg1 = '<script'; Teg2 = '<style'; Teg3 = '<noscript'; Teg4 = '<applet';
Teg5 = '<object'; Teg6 = '<textarea'; Teg7 = '<audio'; Teg8 = '<button';
Teg9 = '<canvas'; Teg10 = '<comment'; Teg11 = '<datalist'; Teg12 = '<del';
Teg13 = '<meter'; Teg14 = '<noembed'; Teg15 = '<optgroup'; Teg16 = '<output';
Teg17 = '<progress';
 
var
Len,I,EndTeg,Differ,J:integer;
DefineTeg:string; (*первые N символов после <*)
Pos1,Pos2:integer;
Pattern:string;
starttime,endtime,q:int64;
begin                    starttime:=GetTickCount;
Len:=Length(Data);
SetLength(Result, Len);
Differ:=0;
J:=0;
if Length(Data) = 0 then Exit else
for I := 1 to Length(Data) do
(*-----------------ЦИКЛ-----------------------------*)
 begin (*2 Cycle*)
  if Differ > 0 then Dec(Differ)
   else
      if Data[i] <> '<' then
             begin
               Inc(J);
               Result[J]:=Data[i]; (**)
             end
      else
         begin
          DefineTeg:=Copy(Data, I,11); (*копируем 12 символов*)
          Pos1:=PosEx(' ',DefineTeg,1); (*позиция первого пробела *)
          if Pos1 = 0 then (*если пробела нет ищем >*)
          Pos1:=PosEx('>',DefineTeg,1); (*позиция первого >*)
          Pos2:=Pos1-1;
          Pattern:=Copy(DefineTeg, 1, Pos2); (*выделяем паттерн тега*)
          (*----выбор тега на CASE------------------------*)
            case  AnsiIndexStr(Pattern,
            [Teg1, Teg2, Teg3, Teg4, Teg5, Teg6, Teg7, Teg8, Teg9,
            Teg10, Teg11, Teg12, Teg13, Teg14, Teg15, Teg16, Teg17]) of
              0:begin
                 EndTeg:=PosEx('</script>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 8);
                end;
              1:begin
                 EndTeg:=PosEx('</style>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 7);
                end;
              2:begin
                 EndTeg:=PosEx('</noscript>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              3:begin
                 EndTeg:=PosEx('</applet>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              4:begin
                 EndTeg:=PosEx('</object>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              5:begin
                 EndTeg:=PosEx('</textarea>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              6:begin
                 EndTeg:=PosEx('</audio>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              7:begin
                 EndTeg:=PosEx('</button>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              8:begin
                 EndTeg:=PosEx('</canvas>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              9:begin
                 EndTeg:=PosEx('</comment>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              10:begin
                 EndTeg:=PosEx('</datalist>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              11:begin
                 EndTeg:=PosEx('</del>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              12:begin
                 EndTeg:=PosEx('</meter>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              13:begin
                 EndTeg:=PosEx('</noembed>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              14:begin
                 EndTeg:=PosEx('</optgroup>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              15:begin
                 EndTeg:=PosEx('</output>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
              16:begin
                 EndTeg:=PosEx('</progress>',Data,I);
                 if (EndTeg > 0) then Differ:=(EndTeg - I + 10);
                end;
            else
              begin
                Inc(J);
                Result[J]:=Data[i];
              end;
          (*------конец CASE------------------------------*)
            end;
         end;
 end;
 (*-------конец Цикла-------------------------------------*)
SetLength(Result, J);
endtime:=GetTickCount; q:=endtime-starttime;  ShowMessage('TIME = '+IntToStr(q));
end;  (*78(три тега) полная набор тегов 218 мС для 3 мб текста*)
и удаляет не один тег, а все 17 парных тегов, ненужных для передачи информации

вот как тут ускорить обработку? может кто подскажет?
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра
Комбинированный вид Комбинированный вид

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 16:12.


 

Сайт

Форум

FAQ

Соглашения

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2025