![]() |
|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
Опции темы | Поиск в этой теме | Опции просмотра |
|
#1
|
|||
|
|||
![]() Здраствуйте, я хочу написать парсер данных с сайта.
Надо из каждого работодателя вытащить данные (название, телефон, почта, сайт, описание), желательно в xls. Реально ли это? В какую сторону копать? Есть ли статьи на эту тему? "Никаких сиплюсплюс тут у меня!" (с)
|
#2
|
||||
|
||||
![]() Pos(), Copy()
Пишу программы за еду. __________________ |
#3
|
|||
|
|||
![]() TWebDocument (по-моему такое название класса) умеет распарсивать сразу тэги (таблицы, ссылки и т.д.), без Pos, Copy и т.д., в инете куча примеров есть.
взялся из неоткуда, ничего не прошу, помогаю просто так ICQ: 593977748 - стучать в случае КРАЙНЕЙ необходимости, ну, или если вы со Ставрополя ![]() |
#4
|
|||
|
|||
![]() Код:
procedure TForm1.FormShow(Sender: TObject); begin WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php'); Memo1.Text:=WebBrowser1.OleObject.Document.documentElement.innerText; end; "Никаких сиплюсплюс тут у меня!" (с)
|
#5
|
||||
|
||||
![]() ну уж тогда:
Код:
uses MSHTML, var document: IHTMLDocument2; all: IHTMLElementCollection; element: IHTMLElement; i: Integer; begin WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php'); while WebBrowser1.ReadyState<READYSTATE_COMPLETE do Application.ProcessMessages; document:=WebBrowser1.Document as IHTMLDocument2; all:=document.all; for i:=0 to all.length-1 do begin element:=all.item(i, '') as IHTMLElement; Memo1.Lines.Add(element.innerText); end; end; Пишу программы за еду. __________________ |
#6
|
|||
|
|||
![]() А можно ли удалять строки из Memo1 с помощью Delete()?
"Никаких сиплюсплюс тут у меня!" (с)
|