Форум по программированию Delphi Sources

 



Вернуться   Форум по программированию Delphi Sources > Общие вопросы > WEB-Программирование
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 09.02.2014, 12:32
Pcrepair
 
Сообщения: n/a
По умолчанию Кодировка Google непонятный тип кодировки

Добрый день. Есть необходимость распарсить лог файл из веб сервера, в частности получить текст запроса из поисковика, по которому был вход на страницу
с Яндексом все понятно: http://yandex.ru/yandsearch?text=%D1...0%D1%8C&lr=213 тут UTF-8, где символ кирилицы = %D1, можно декодировать, уже сделано

с Гуголь все сложнее:
http://www.google.com/url?sa=t&rct=j...60799247,d.aWc

Вопросы:
1. что тут кодирует символ, строка типа =&esrc или что это вообще?
2. как получить на кирилице текст поискового запроса?
Ответить с цитированием
  #2  
Старый 09.02.2014, 19:38
lmikle lmikle вне форума
Модератор
 
Регистрация: 17.04.2008
Сообщения: 7,563
Версия Delphi: 7, XE3, 10.2
Репутация: 49089
По умолчанию

а это не поисковый запрос. Это уже "клик" по одной из ссылок.
Ответить с цитированием
  #3  
Старый 10.02.2014, 11:06
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
Радость

запиши адрес в таком виде
Код HTML:
http://www.google.com/url ?sa=t &rct=j &q= &esrc=s &frm=1 &source=web &cd=9 &ved=0CGQQFjAI &url=http%3A%2F%2Frad.service.ru%2Findex16.php &ei=--DyUrC3GeeuyQG47YDADg &usg=AFQjCNGMjRlIkW1XDpJRuKAZIUQRNlbbsg &bvm=bv.60799247,d.aWc
и станет понятней. запрос идет на http://www.google.com/url + 12 параметров.
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
  #4  
Старый 10.02.2014, 16:51
Pcrepair
 
Сообщения: n/a
По умолчанию

на самом деле, как стало ясно, у хугля кодировка поискового запроса то же в УТФ8 и заключена между символами q= и первым & а шмондекса между text= и тоже &
судя по тому что на веб-сервере австатс декодирует поисковые запрсы эта схема стабильна
Ответить с цитированием
  #5  
Старый 10.02.2014, 16:58
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
По умолчанию

Клиент может передавать параметры запроса после символа ?. Параметр имеет формат имя_параметра=значение_параметра, сами параметры разделяются знаком &.
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
  #6  
Старый 11.02.2014, 17:01
Pcrepair
 
Сообщения: n/a
По умолчанию

при чем тут клиент?
речь идет о записях в логфайле веб-сервера
а откуда и как беруться эти записи - это отдельная загадка
Ответить с цитированием
  #7  
Старый 11.02.2014, 17:52
Аватар для poli-smen
poli-smen poli-smen вне форума
Профессионал
 
Регистрация: 06.08.2012
Адрес: Кривой Рог
Сообщения: 1,791
Версия Delphi: Delphi 7, XE2
Репутация: 4415
По умолчанию

Цитата:
Сообщение от Pcrepair
при чем тут клиент?
речь идет о записях в логфайле веб-сервера
а откуда и как беруться эти записи - это отдельная загадка
При чём тут логфайл веб-сервера? Вопрос же был в том что означают символы в адресе страниц интернета? Ну вот это и был ответ: после символа ? начинаются параметры которые разделяются знаком &, имя параметра от своего значения разделяются знаком =. Вот описание в Википедии: Структура URL. Сами же параметры имеют смысл только для самого веб-сервера и не обязательно могут быть расшифрованы клиентом в осмысленный текст.
Ответить с цитированием
  #8  
Старый 11.02.2014, 18:34
Аватар для NumLock
NumLock NumLock вне форума
Let Me Show You
 
Регистрация: 30.04.2010
Адрес: Северодвинск
Сообщения: 5,426
Версия Delphi: 7, XE5
Репутация: 59586
По умолчанию

Цитата:
Сообщение от Pcrepair
при чем тут клиент?
при том, что именно клиент в итоге формирует и посылает запрос для сервера, на основе данных, которые сервер передал клиенту, либо ввел пользователь. если не понятна кодировка, задай понятную через meta charset.
__________________
Пишу программы за еду.
__________________
Ответить с цитированием
Ответ



Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 17:21.


 

Сайт

Форум

FAQ

RSS лента

Прочее

 

Copyright © Форум "Delphi Sources", 2004-2020

ВКонтакте   Facebook   Twitter