Периодически поднимается вопрос об открытых для дополнения программных средствах анализа данных, наиболее известным из которых является Weka. Хочу упомянуть проект RapidMiner, доступный в бесплатной версии (Community Edition).
В кратких сведениях указана полная интеграция проекта Weka и как рабочее место аналитика эта программа более развита. Визуальный редактор анализа данных, мастера импорта, возможность выполнения скриптов R, визуализация.
Что касается внедрения собственных алгоритмов и методик анализа, то
- Программа доступна в виде исходных кодов версии Community Edition (в более скромной функциональности и отсутствии сопровождения);
- Поставка в версии Developer Edition допускает использование в виде библиотеки при интеграции с более общей информационной системой;
- Есть механизм расширений (дополнительных спецификаций как им пользоваться не нашел).
Он написан тоже на Java?
Неплохо было бы поместить информацию о том какие методы и алгоритмы подерживает данная версия RapidMiner-a…
Есть ли интерфейс командной строки как в Weka? Совместима ли она с файлами данных Wekа, R ?
Написан на Java, т.е. пользователи Linux и Mac могут пользоваться.
За подробностями использования надо идти на сайт производителя. Мне не хотелось бы собирать эту информацию, т.к. я в работе rapidMiner пока не использую.
OK. Cпасибо!