Data Stermer - инструмент помогает вам получать контент из всевозможных социальных сетей. Это позволяет извлекать метаданные с использованием обработки на естественном языке.
Простой в использовании API Вы можете начать работу с Datastreamer менее чем за час. Если вы используете Java, вы сможете начать сбор данных за считанные минуты. Если вы используете другой язык, вам нужно анализировать только несколько файлов JSON каждые несколько секунд.
Построен на веб-стандартах Создан с нуля, чтобы индексировать сырой HTML5. Сюда входят метаданные HTML, в том числе микроформаты и микроданные, - именно так Google и другие поисковые системы индексируют свой контент. Платформа также индексирует RSS и Atom (включая все 9 различных вариантов RSS). Обычные парсеры RSS хрупкие, но только не этот.
Надежная инфраструктура Инфраструктура платформы является самой современной и предназначена для масштабирования. Все размещено на сверхбыстрых дисках SSD. Более 150 серверов в постоянной работе и компания хранит более 40 ТБ текстового контента. Каждый элемент инфраструктуры спроектирован с тройным резервированием и дополнительным оборудованием в режиме ожидания в случае сбоя. Data streamer контролируется 24/7 на предмет возможных ошибок в системе.
Особенности: - Интегрированный полнотекстовый поиск на базе Kibana и Elasticsearch.
- Интегрированное удаление шаблонов и контента на основе методов поиска информации.
- Построен на отказоустойчивой инфраструктуре и обеспечивает высокую доступность информации.
- Простая в использовании и всеобъемлющая консоль администратора.