Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > Интернет и сети
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

 
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 12.08.2012, 21:16
Аватар для Uniq!
Uniq! Uniq! вне форума
Местный
 
Регистрация: 29.09.2010
Сообщения: 539
Версия Delphi: Delphi XE3
Репутация: 374
По умолчанию Многократный Парсинг Блоков

Использую: TPerlRegEx

Задача: разобрать конечное количество однообразных блоков страницы.

Пример блока:

Код HTML:
<tr class="even"> <td align="right">1</td> <td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td> <td>Planeswalker — Ajani (Loyalty: 4)</td> <td>1WW</td> <td>Mythic Rare</td> <td>D. Alexander Gregory</td> <td><img src="http://magiccards.info/images/en.gif" alt="English" width="16" height="11" class="flag2"> Magic 2013</td> </tr>

Код ВСЕЙ страницы получаю по средствам str: = TIdHttp.Get('url.html'); (сомнительно, что это грамотно в этом случае )

Собственно регулярка вот:
Код HTML:
<td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td> RegEx.RegEx := '<td><a href="/m13/en/(.*?).html">(.*?)</a></td>';


Вытащить надо естественно каждую колонку ( <td> ... </td> )
Код:
cNum := RegEx.Group[1]; \\ номер элемента
cName := RegEx.Group[2]; \\ имя элемента
Как быть с остльным? cType(Planeswalker ), cSubType(Ajani), cCmC(1WW)

Последний раз редактировалось Uniq!, 12.08.2012 в 21:19.
Ответить с цитированием
 


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 10:37.


 

Сайт

Форум

FAQ

Соглашения

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2025