产业气象站|还发现个可挑战Jupyter的杀手,AI创业公司最佳开发工具指南火了( 二 )


SigmaPolarisCEO表示 , Pandas可能是最有价值的工具之一 , 尤其是在与外部开发人员合作进行各种项目时 。 所有的数据以数据框架的形式存在 , 协作更加流畅 , 减少了不必要的麻烦 。
提到可视化 , Matplotlib、Plotly是最多的选择 。
还有公司推荐了Dash , 它是一个在Plotly图表为基础建立的交互式仪表盘的工具 , 这对于用户来说更加友好 。
对于标准的机器学习问题 , 大多数团队使用Scikit-Learn和XGBoost , 尤其是Scikit-Learn 。
iSchoolConnect公司就解释道:
Scikit-Learn是机器学习研究人员、工程师和开发人员最常用的工具箱之一 。 你可以轻松获得你想要的东西 , 这一点让人惊叹不已!对于深度学习框架而言 , PyTorch、Tensorflow+Keras很受团队欢迎 。
而在具体的方向上 , 比如NLP , Huggingface、Spacy、Gensim是常用的工具 , CV方面 , OpenCV无疑是必需的了 。
MLOps
类似于DevOps , 有人称 , MLOps是用于机器学习的DevOps 。
MLOps是将模型集成并部署到生产系统中的所有工具 。
这包括模型被部署到哪里 , 如何到达哪里 , 如何被更大的软件/应用程序访问 , 如何跟踪ML模型在现实世界中的性能 , 以及如何对模型进行实时管理和测试 。
每个团队针对于自身的不同任务 , 所使用的工具也不尽相同 。
产业气象站|还发现个可挑战Jupyter的杀手,AI创业公司最佳开发工具指南火了
文章图片
调查的结果如下:
编排:Kubeflow , Airflow , AmazonSagemaker , Azure
模型包装/服务:Kubeflow , MLflow , AmazonSagemaker
模型从训练到推理的剖析和优化:pytest-benchmark、MLperf
实验管理:MLflow , Comet , Neptune
总的来说 , 很多团队用Jupyter进行探索 , 用Pycharm/VSCode进行开发 。
他们都喜欢GitHub , Python语言使用的最多 。
对于深度学习框架 , 他们更喜欢使用Tensorflow、Keras和Pytorch 。
值得注意的是 , 越来越多的人开始使用高级的PyTorch训练框架 , 如Lightning、Ignite、Catalyst、fastai和Skorch 。
在可视化探索方面 , 人们使用matplotlib,plotly,altair和hiplot 。
对于实验跟踪 , 团队通常使用如TensorBoard、MLflow和Sacred这些的开源软件包 。
【来源:量子位】
声明:转载此文是出于传递更多信息之目的 。 若有来源标注错误或侵犯了您的合法权益 , 请作者持权属证明与本网联系 , 我们将及时更正、删除 , 谢谢 。 邮箱地址:newmedia@xxcb.cn