Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > [ "Начинающим" ]
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 24.04.2011, 13:18
iGeTT iGeTT вне форума
Прохожий
 
Регистрация: 23.12.2010
Адрес: Moscow
Сообщения: 38
Версия Delphi: 7 Lite
Репутация: 10
По умолчанию Парсинг данных с сайта

Здраствуйте, я хочу написать парсер данных с сайта.
Надо из каждого работодателя вытащить данные (название, телефон, почта, сайт, описание), желательно в xls.
Реально ли это? В какую сторону копать? Есть ли статьи на эту тему?
__________________
"Никаких сиплюсплюс тут у меня!" (с)
Ответить с цитированием
  #2  
Старый 24.04.2011, 13:40
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
По умолчанию

Pos(), Copy()
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
  #3  
Старый 24.04.2011, 15:14
Assistant Assistant вне форума
Продвинутый
 
Регистрация: 20.02.2011
Адрес: там где правят идиоты
Сообщения: 603
Версия Delphi: 7
Репутация: выкл
По умолчанию

TWebDocument (по-моему такое название класса) умеет распарсивать сразу тэги (таблицы, ссылки и т.д.), без Pos, Copy и т.д., в инете куча примеров есть.
__________________
взялся из неоткуда, ничего не прошу, помогаю просто так
ICQ: 593977748 - стучать в случае КРАЙНЕЙ необходимости, ну, или если вы со Ставрополя
Ответить с цитированием
  #4  
Старый 24.04.2011, 17:15
iGeTT iGeTT вне форума
Прохожий
 
Регистрация: 23.12.2010
Адрес: Moscow
Сообщения: 38
Версия Delphi: 7 Lite
Репутация: 10
По умолчанию

Код:
procedure TForm1.FormShow(Sender: TObject);
begin
  WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php');
  Memo1.Text:=WebBrowser1.OleObject.Document.documentElement.innerText;
end;
После запуска вылетает, метит на строчку Memo1.Text...
__________________
"Никаких сиплюсплюс тут у меня!" (с)
Ответить с цитированием
  #5  
Старый 24.04.2011, 17:47
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
По умолчанию

ну уж тогда:
Код:
uses
  MSHTML, 

var
  document: IHTMLDocument2;
  all: IHTMLElementCollection;
  element: IHTMLElement;
  i: Integer;
begin
  WebBrowser1.Navigate('http://jobinmoscow.ru/rab.php');
  while WebBrowser1.ReadyState<READYSTATE_COMPLETE do
    Application.ProcessMessages;
  document:=WebBrowser1.Document as IHTMLDocument2;
  all:=document.all;
  for i:=0 to all.length-1 do
  begin
    element:=all.item(i, '') as IHTMLElement;
    Memo1.Lines.Add(element.innerText);
  end;
end;
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
  #6  
Старый 24.04.2011, 20:29
iGeTT iGeTT вне форума
Прохожий
 
Регистрация: 23.12.2010
Адрес: Moscow
Сообщения: 38
Версия Delphi: 7 Lite
Репутация: 10
По умолчанию

А можно ли удалять строки из Memo1 с помощью Delete()?
__________________
"Никаких сиплюсплюс тут у меня!" (с)
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра
Комбинированный вид Комбинированный вид

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 07:52.


 

Сайт

Форум

FAQ

Соглашения

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2025