Парсинг данных с сайта

iGeTT · #1 24.04.2011, 13:18

Здраствуйте, я хочу написать парсер данных с сайта.
Надо из каждого работодателя вытащить данные (название, телефон, почта, сайт, описание), желательно в xls.
Реально ли это? В какую сторону копать? Есть ли статьи на эту тему?

NumLock · #2 24.04.2011, 13:40

Pos(), Copy()

Assistant · #3 24.04.2011, 15:14

TWebDocument (по-моему такое название класса) умеет распарсивать сразу тэги (таблицы, ссылки и т.д.), без Pos, Copy и т.д., в инете куча примеров есть.

iGeTT · #4 24.04.2011, 17:15

Код:

procedure TForm1.FormShow(Sender: TObject);
begin
  WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php');
  Memo1.Text:=WebBrowser1.OleObject.Document.documentElement.innerText;
end;

После запуска вылетает, метит на строчку Memo1.Text...

NumLock · #5 24.04.2011, 17:47

ну уж тогда:

Код:

uses
  MSHTML, 

var
  document: IHTMLDocument2;
  all: IHTMLElementCollection;
  element: IHTMLElement;
  i: Integer;
begin
  WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php');
  while WebBrowser1.ReadyState<READYSTATE_COMPLETE do
    Application.ProcessMessages;
  document:=WebBrowser1.Document as IHTMLDocument2;
  all:=document.all;
  for i:=0 to all.length-1 do
  begin
    element:=all.item(i, '') as IHTMLElement;
    Memo1.Lines.Add(element.innerText);
  end;
end;

iGeTT · #6 24.04.2011, 20:29

А можно ли удалять строки из Memo1 с помощью Delete()?

Опции темы	Поиск в этой теме
Версия для печати Отправить на Email	Поиск в этой теме: Расширенный поиск
Опции просмотра
Линейный вид Комбинированный вид Древовидный вид

	Сайт	Форум	FAQ	Соглашения	Прочее
	Новости Исходники Компоненты Статьи Добавить исходник Поиск	Правила Поиск Сообщения за сегодня Пользователи Кто на форуме?	Delphi FAQ - 5000 статей DRKB - 4500 статей (ZIP-архив) Справочник функций и процедур Delphi Delphi Programming Guide Indy in Depth. Глубины Indy	Конфиденциальность Соглашение пользователя Правила обработки cookie	О сайте Donate Контакты