最全数据科学C/C++机器学习库整理,再也不用百度搜了( 二 )


GitHub:
CRF++ -- 用于分段/标记顺序数据的条件随机字段 (CLF) 的开源实现和其他自然语言处理任务 。 [已弃用]
GitHub:
CRFsuite -- CRFifsuite 是用于标记顺序数据的条件随机字段 (CLF) 的实现 。 [已弃用]
GitHub:
CRF 模型 -- 基于不同深度学习的 CRF模型 。 frog --为荷兰语开发的基于内存的NLP套件:PoS 标记器、lemmatizer、依赖分析器、NER、浅层解析器、形态分析仪 。
GitHub:
MeTA -- ModErn 文本分析是一个 C++ 数据科学工具包 , 有助于挖掘大文本数据 , 包括文本标记化 , 包括解析树、主题模型、分类算法、图形算法、语言模型、多线程算法等深层语义功能 。
官方文档:
MIT信息提取工具包 -- C、C++ 和 Python 工具 , 用于命名实体识别和关系提取
GitHub:
ucto -- 用于各种语言的 Unicode 感知正则表达式标记器、工具和C++库 , 支持 FoLiA 格式 。
GitHub:
16. 数据流挖掘
StreamDM: 适用于挖掘支持以下算法的大数据流 。
GitHub:
SGD 学习者和感知器:

  • 朴素贝叶斯
  • CluStream
  • Hoeffding决策树
  • Bagging
  • 流KM ++
数据产生器:
  • HyperplaneGenerator
  • RandomTreeGenerator
  • RandomRBFGenerator
  • RandomRBFEventsGenerator
17. 数据结构/图形/动态编程算法
GitHub:
18. 通用机器学习
Darknet -- Darknet是一个开源神经网络框架 , 用 C 和 CUDA 编写 , 支持 CPU 和 GPU 计算 。
GitHub:
cONNXr -- ONNX 运行时以纯 C (99) 编写 , 零依赖关系集中在小型嵌入式设备上 。 对机器学习模型进行推理 , 无论您使用哪个框架进行训练 。 易于安装和编译无处不在 , 即使在非常旧的设备 。
GitHub:
BanditLib -- 一个简单的多臂Bandit库 。 [已弃用]
GitHub:
CUDA -- 这是一个快速 C++/CUDA 实现卷积深度学习
官方文档:
DeepDetect -- 一个用 C++ 11编写的机器学习API和服务器 。 它使最先进的机器学习易于使用并集成到现有应用程序中 。
GitHub:
分布式机器学习工具包 (DMTK) -- 微软的分布式机器学习(参数服务器)框架 。 在多台机器上启用大型数据集的训练模型 。 与它捆绑的当前工具包括:LightLDA 和分布式(多感)字嵌入 。
官网:(已停用)
DLib -- 一套 ML 工具 , 设计为易于在其他应用中安装 。
官网:
DSSTNE -- 由亚马逊创建的软件库 , 用于使用 GPU 训练和部署深度神经网络 , 该软件库强调速度和扩展性 , 而不是实验灵活性 。
GitHub:
Fido -- 用于嵌入式电子和机器人技术的高度模块化 C++ 机器学习库 。
GitHub:
igraph -- 通用图形库 。
官方文档:
英特尔DAAL -- 由英特尔开发并针对英特尔架构进行优化的高性能软件库 。 库为数据分析的所有阶段提供了算法构建块 , 并允许以批处理 , 联机和分布式模式处理数据 。
GitHub:
libfm -- 一种通用方法 , 可以通过特征工程模拟大多数分解模型 。
GitHub:
MLDB -- 机器学习数据库是为机器学习而设计的数据库 。 通过RESTful API发送命令以存储数据 , 使用SQL探索数据 , 然后训练机器学习模型 , 并将其公开为API 。
官方文档:
MXNet -- 具有动态 , 可感知突变的Dataflow Dep Scheduler的轻量 , 便携式 , 灵活的分布式/移动深度学习;适用于Python , R , Julia , Go , Javascript等 。
GitHub:
proNet-core -- 通用网络嵌入框架:成对表示优化Network Edit 。
GitHub:
PyCUDA -- CUDA的Python接口
官方文档:
ROOT -- 模块化的科学软件框架 。 它提供了处理大数据处理 , 统计分析 , 可视化和存储所需的所有功能 。
官网:
sofia-ml -- 快速增量算法套件 。
官网:
Stan -- 一种概率编程语言 , 利用汉密尔顿蒙特卡洛采样实现完整的贝叶斯统计推断 。
官方文档:
Timbl -- 一种软件包/ C ++库 , 实现了几种基于内存的学习算法 , 其中IB1-IG是k最近邻分类的实现 , 而IGTree是IB1-IG的决策树近似 , 常用于NLP 。
GitHub:
Vowpal Wabbit(VW) -- 一个快速的核心学习系统 。
GitHub:
Warp-CTC -- 在CPU和GPU上快速并行地实现连接主义时间分类(CTC) 。
GitHub:
ThunderSVM -- 在GPU和CPU上的快速SVM库 。
GitHub:
LKYDeepNN -- 仅标头的 C++11 神经网络库 。 低依赖性 , 本地繁体中文文档 。