Я бы сделал через БД.
Хотя можно делать и полностью кодом (как-то писал такое).
Собственно:
1. Не надо файл грузить полностью сразу. Особенно, если он "весит" несколько десятков мегабайт или больше. Читай построчно.
2. Результат складываешь в отдельный списочек.
Тут встает вопрос правильного определения нужно ли добавлять запись в результат. Номера в списке повторяются или нет? Если нет, то все просто. Если да, то надо понимать будет ли включен номер в результат.
|