Многократный Парсинг Блоков

Uniq! · #1 12.08.2012, 21:16

Использую: TPerlRegEx

Задача: разобрать конечное количество однообразных блоков страницы.

Пример блока:

Код HTML:

  <tr class="even">
    <td align="right">1</td>
    <td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td>
    <td>Planeswalker — Ajani (Loyalty: 4)</td>
    <td>1WW</td>
    <td>Mythic Rare</td>
    <td>D. Alexander Gregory</td>
    <td><img src="http://magiccards.info/images/en.gif" alt="English" width="16" height="11" class="flag2"> Magic 2013</td>
  </tr>

Код ВСЕЙ страницы получаю по средствам str: = TIdHttp.Get('url.html'); (сомнительно, что это грамотно в этом случае

)

Собственно регулярка вот:

Код HTML:

                <td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td>
RegEx.RegEx := '<td><a href="/m13/en/(.*?).html">(.*?)</a></td>';

Вытащить надо естественно каждую колонку ( <td> ... </td> )

Код:

cNum := RegEx.Group[1]; \\ номер элемента
cName := RegEx.Group[2]; \\ имя элемента

Как быть с остльным? cType(Planeswalker ), cSubType(Ajani), cCmC(1WW)

Опции темы	Поиск в этой теме
Версия для печати Отправить на Email	Поиск в этой теме: Расширенный поиск
Опции просмотра
Линейный вид Комбинированный вид Древовидный вид

	Сайт	Форум	FAQ	Соглашения	Прочее
	Новости Исходники Компоненты Статьи Добавить исходник Поиск	Правила Поиск Сообщения за сегодня Пользователи Кто на форуме?	Delphi FAQ - 5000 статей DRKB - 4500 статей (ZIP-архив) Справочник функций и процедур Delphi Delphi Programming Guide Indy in Depth. Глубины Indy	Конфиденциальность Соглашение пользователя Правила обработки cookie	О сайте Donate Контакты