да сейчас пользуюсь такой же конструкцией:
Doc:= WebBrowser.Document as IHTMLDocument2;
Content:=doc.body.innerHTML;
НО, похоже здесь происходит сохранение именно структуры страницы, а не исходного HTML, потому что если сравнить код сайта и то что так сохраняется то есть различия, например тэги с больших букв, порядок свойств разный, некоторые значения свойств не в скобках.
Вообще с виду не критично, но что-то подсказывает что надёжнее парсить оригинал.
|