![]() |
|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
Опции темы | Поиск в этой теме | Опции просмотра |
|
#1
|
|||
|
|||
![]() Собираемся создать базу для хранения и поиска большого объема текстовых документов (порядка 100000 документов, с общим объемом поряка 2гб).
Какую базу посоветуйте выбрать? База все время будет редактироваться и пополняться новыми документами. Каждый документ должен иметь атрибуты /дата ввода, дата последней редакции, номер, тип, автор и т.д./ по которым будут искать документы. |
#2
|
||||
|
||||
![]() Если правильно организовать хранение - то любая, хоть dbf
Некоторые программисты настолько ленивы, что сразу пишут рабочий код. Если вас наказали ни за что - радуйтесь: вы ни в чем не виноваты. |
#3
|
|||
|
|||
![]() Цитата:
|
#4
|
|||
|
|||
![]() Нет, не остаются. Там другого рода проблема - управление пространством. Если периодически делать сжатие базы, то размер будет нормальным. Но в dbf, конечно, лучше большие данные не хранить.
Если совсем нет внешних ограничений на выбор, то я взял бы какую-нить Netezza. Ну или просто Oracle или PostgreeSQL. |
#5
|
||||
|
||||
![]() Вопрос стоит в том, что хранить и как хранить (и сколько это обойдется в деньгах). Если документы по 5-6 индексным полям, то можно хоть txt+zip (для документов) и до миллиона записей - все в ёлку.
Некоторые программисты настолько ленивы, что сразу пишут рабочий код. Если вас наказали ни за что - радуйтесь: вы ни в чем не виноваты. |
#6
|
|||
|
|||
![]() О деньгах не беспокойтесь.
Что кроется под "txt+zip (для документов)". Означает ли это хранение текстов вне базы данных - в отдельных текстовых или в zip файлах? Тогда как быть с поиском в текстах документов? |