|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
|
Опции темы | Поиск в этой теме | Опции просмотра |
|
#1
|
|||
|
|||
Кодировка Google непонятный тип кодировки
Добрый день. Есть необходимость распарсить лог файл из веб сервера, в частности получить текст запроса из поисковика, по которому был вход на страницу
с Яндексом все понятно: http://yandex.ru/yandsearch?text=%D1...0%D1%8C&lr=213 тут UTF-8, где символ кирилицы = %D1, можно декодировать, уже сделано с Гуголь все сложнее: http://www.google.com/url?sa=t&rct=j...60799247,d.aWc Вопросы: 1. что тут кодирует символ, строка типа =&esrc или что это вообще? 2. как получить на кирилице текст поискового запроса? |
#2
|
|||
|
|||
а это не поисковый запрос. Это уже "клик" по одной из ссылок.
|
#3
|
||||
|
||||
запиши адрес в таком виде
Код HTML:
Пишу программы за еду. __________________ |
#4
|
|||
|
|||
на самом деле, как стало ясно, у хугля кодировка поискового запроса то же в УТФ8 и заключена между символами q= и первым & а шмондекса между text= и тоже &
судя по тому что на веб-сервере австатс декодирует поисковые запрсы эта схема стабильна |
#5
|
||||
|
||||
Клиент может передавать параметры запроса после символа ?. Параметр имеет формат имя_параметра=значение_параметра, сами параметры разделяются знаком &.
Пишу программы за еду. __________________ |
#6
|
|||
|
|||
при чем тут клиент?
речь идет о записях в логфайле веб-сервера а откуда и как беруться эти записи - это отдельная загадка |