![]() |
|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
Опции темы | Поиск в этой теме | Опции просмотра |
#1
|
|||
|
|||
![]() стоит задача получать HTML именно из браузера, а хождение именно браузером обусловлено тем что например эмулировать работу ява-скрипра, работу с куками, в конечном счёте очень трудоёмко, проще идти через браузер он сам всё сделает как надо.
Рассматриваю 4 варианта получения HTML из браузера: - автоматизация (удобно именно в хроме) здесь удобен именно хром, потому как он удобно позволяет в строке запроса указать что нужен именно исходник пример: если в строке браузера написать view-source:ya.ru он выдаст сразу HTML. Очень удобно, дальше достаточно просто можно эмулировать нажатие комбинаций кнопок (keybd_event) т.е. CTRL+A, CTRL+C, но остановился на проблеме что после CTRL+C не получается прочитать буфер вылетает ошибка "Cannot open clipboad" как не боролся, не читал инет пока не победил. НО тут пришла идея ещё про 3 варианта. - прокси прогонять браузер через прокси и брать HTML уже из прокси, нашёл исходники прокси попробывал через него работает нереально медленно. Вариант интересный нужно найти подходящий работающий прокси сервер с которого можно брать HTML - снифер слушать интерфейс, нашёл исходники снифера работает хорошо, но не могу разобраться с кодировкои и чтобы приходило текстом а не блоками. - WinAPI читать с элементов интерфейса сообщением WM_GETTEXT, так как с notepad`ом дело не пройдёт, хром посложнее будет. Пробовал читать со всех хэндлов, которые висят в памяти от хрома, не получилось. |
#2
|
|||
|
|||
![]() выбран именно chrome из-за скорости работы.
|
#3
|
||||
|
||||
![]() а вот с TWebBrowser еще проще и все работает без эмуляции нажатия кнопок:
Код:
(WebBrowser.Document as IHTMLDocument2).body.innerHTML Пишу программы за еду. __________________ |
#4
|
|||
|
|||
![]() да есть такой, но этот прелестный WebBrowser уже стал очень медленно грузить современные сайты вплоть до того что не полностью их погружает, уже не говорю про ошибки ява скрипта отработка которого обязательно на некоторых сайтах.
Короче с самого начала именно им и пользовались теперь он не устраивает совсем. |
#5
|
|||
|
|||
![]() delphichromiumembedded ?
>woweook< |
#6
|
|||
|
|||
![]() Цитата:
по этому проекту ничего не скажу, но с ним тоже самое что и с TWebBrowser сейчас он может и нормально отрабатывает, а что с ним будет через год два. Поэтому и приняли решение использовать обычный браузер, версии его выходят стабильно в соответствии с появлением новых стандартов. |
#7
|
|||
|
|||
![]() Да уж интересная программа будет. Чтобы запустить нужно установить целый браузер. Никогда бы не пользовался такой и начальству бы пожаловался на программистов
|
#8
|
|||
|
|||
![]() тогда изобретайте на основе selenium или phantomJS
на имеющих отношение к веб языках много такого готового есть, возможно на .net есть >woweook< Последний раз редактировалось Pyro, 09.08.2012 в 20:14. |
#9
|
|||
|
|||
![]() Цитата:
|
#10
|
|||
|
|||
![]() Цитата:
phantomJS - так понял что это скрипты на яваскрипте, через него с базой не поработаешь. Последний раз редактировалось ffjeroifjeo, 10.08.2012 в 14:53. |