|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
|
Опции темы | Поиск в этой теме | Опции просмотра |
#1
|
|||
|
|||
Простой парсер, не могу получить href из html (DOM)
Всем привет. Помогите написать простенький парсер, не могу получить href в финале.
Выдергивает все что Li, потом внутри в h3, а потом в A. Код:
vTags := WebBrowser1.OleObject.Document.getElementsByTagName('Li'); n1:=vTags.Length; if n1>0 then begin for i1:=0 to n1-1 do begin vTags1 := vTags.item(i1).getElementsByTagName('H3'); n2:=vTags1.Length; if n2>0 then begin for i2:=0 to n2-1 do begin sMemo2.Lines.Add(vTags1.item(i2).InnerHTML); end; end; end; end; В sMemo2 получается: Код:
<A href="http://www.google.ru/url?url=http://www.elle.ru/tests/&rct=j&frm=1&q=&esrc=s&sa=U&ved=0CBMQFjAAahUKEwj4n4380ZnHAhWI2SwKHdhEB2A&usg=AFQjCNFKGc7G2o3Ta0OKGyFYhC8EjSKUHg" target=_blank><B>?????</B> ??????: ?????? ??????????????? <B>?????</B> ?????????, ??? <B>...</B></A> Как получить href? Чето не пойму. Спасибо. |
#2
|
||||
|
||||
Конечный автомат используй.
— Как тебя понимать? — Понимать меня не обязательно. Обязательно меня любить и кормить вовремя. На Delphi, увы, больше не программирую. Рекомендуемая литература по программированию |
#3
|
|||
|
|||
Цитата:
|
#4
|
|||
|
|||
а в чем проблема то?
я бы просто нашел <A href=" а потом target=_blank>,все что между ними в переменную ну или куда тебе нужно? |
#5
|
||||
|
||||
Цитата:
https://ru.wikipedia.org/wiki/%D0%9A...BC%D0%B0%D1%82 Это то, на чем строятся все парсеры. — Как тебя понимать? — Понимать меня не обязательно. Обязательно меня любить и кормить вовремя. На Delphi, увы, больше не программирую. Рекомендуемая литература по программированию |
#6
|
|||
|
|||
Ну, если ты через DOM уже достал ссылку, то считай ее аттрибут href и, видимо, будет тебе счастье.
Код:
aHref := vTags1.item(i2).getAttribute('href'); |