Многопоточная Обработка web-страниц

Uniq! · #1 01.09.2012, 18:08

В общем в таблице есть список ссылок, по которым надо пройтись (Скачать) распарсить. Всё что касается парсинга и скачивания уже готово.

На 2к страниц тратится около 9-15 минут, естественно без учёта ширины канала, и мощности компьютера. Хотелось бы как-то это оптимизировать.

google подсказал многопоточность. Только вот вопросы возникли: как контролировать количество потоков? Как передавать потоку ТУ ссылку, которая ещё не обработана?

NumLock · #2 02.09.2012, 08:47

-завести глобальный счетчик потоков
-при создании потока инкрементировать значение, при завершении декрементировать, естественно в критических секциях
-ссылку очень удобно передать в конструктор потока

Uniq! · #3 02.09.2012, 11:09

А как отследить ссылка уже в обработке или ещё её никто "не трогал".
Собрать класс TLink с двумя свойствами fLink и fBusy? пойдёт такое решение?

NumLock · #4 02.09.2012, 11:27

ну а как у тебя сейчас отслеживается? нужно ли вообще отслеживать?
в классе потока достаточно только ссылку описать. сделать 3 глобальные функции, код защитить критическими секциями: inc_num, dec_num, get_num. в цикле по списку ссылок создавать ограниченное количество потоков (get_num < X). при создании нового потока счетчик увеличивается, при разрушении уменьшается.
можно и через семафор сделать контроль количества потоков.

Опции темы	Поиск в этой теме
Версия для печати Отправить на Email	Поиск в этой теме: Расширенный поиск
Опции просмотра
Линейный вид Комбинированный вид Древовидный вид

	Сайт	Форум	FAQ	RSS лента	Прочее
	Новости Исходники Компоненты Статьи Добавить исходник Поиск	Правила Поиск Сообщения за сегодня Пользователи Кто на форуме?	Delphi FAQ - 5000 статей DRKB - 4500 статей (ZIP-архив) Справочник функций и процедур Delphi Delphi Programming Guide Indy in Depth. Глубины Indy	Новости сайта Новости форума	Ссылки и Баннеры Donate О сайте Реклама Контакты