Не использующие SQL системы обработки данных, такие как Hadoop и
MapReduce, могут быть очень дешевыми и прекрасно масштабироваться. Тем
не менее, по скорости написания запросов и простоте использования они
проигрывают традиционным реляционным базам данных. И вот, ученые из
Йельского университета (Yale University), кажется, сумели взять лучшее
от обеих концепций: они создали гибридную систему, отличающуюся высокой производительностью и практически неограниченной масштабируемостью.
HadoopDB анонсировал в своем блоге профессор Йельского
университета Daniel J. Abadi. Система собрана из нескольких opensource
компонентов, включающих PostgreSQL, Apache Hadoop и модуль сортировки
Hive. Она принимает запросы, написанные как в формате MapReduce, так и
в традиционной SQL форме. Обработка запросов осуществляется частично
движком Hadoop, и частично некоторым числом экземпляров PostgreSQL,
объединенных в shared-nothing кластер. Исходные тексты новой системы обработки данных доступны
под лицензией APL 2.0. Решение на базе HadoopDB должно понравится
сторонникам движения 'NoSQL', ратующим за отказ от использования
структурированного языка запросов. Корпоративные потребители, ищущие
недорогую масштабируемую альтернативу своим проприетарным решениям на
базе Oracle Database, IBM DB2 или MSSQL, могут тоже обратить внимание
на этот проект.
Источник: http://www.opennet.ru/opennews/art.shtml?num=22696
|