产业气象站|还发现个可挑战Jupyter的杀手,AI创业公司最佳开发工具指南火了
白交发自凹非寺量子位报道|公众号QbitAI
一份AI创业公司最佳「开发工具」指南 , 火了 。
Reddit上 , 一份来自41家创业公司的调研答案 , 热度已达471 。

文章图片
除了比较流行的开发环境Jupyter以外 , 还出现了这样一个身影——Deepnote 。
小团队制作 , 堪称可挑战「JupyterNotebook」的Deepnote , 目前已经有少数公司在使用了 。

文章图片
网友纷纷表示要去试试 。
于是进一步吸引了Deepnote开发者亲自过来答疑 。
所以这究竟是一份怎样的指南?还有哪些其他有意思的开发工具?
调研结果
这份调查来自一家轻量工具集成网站neptune.ai , 他们采访了41家AI初创公司 。

文章图片
调查结果如下:
软件开发设置
IDE:JupyterLab+NB扩展(少数用Deepnote) , Colab和PyCharm、VSCode(R用户喜欢Rstudio)
Github
Python(大多数) , R(部分)
机器学习框架
处理数据和可视化:Pandas+Matplotlib+Plotly
经典算法:Sklearn+XGBoost
深度学习:Tensorflow+Keras或Pytorch
MLOps
编排:Kubeflow , Airflow , AmazonSagemaker , Azure
模型包装/服务:Kubeflow , MLflow , AmazonSagemaker
模型从训练到推理的剖析和优化:pytest-benchmark、MLperf
实验管理:MLflow , Comet , Neptune
具体情况 , 是这样的 。
【产业气象站|还发现个可挑战Jupyter的杀手,AI创业公司最佳开发工具指南火了】软件开发设置
开发环境是每个团队工作流程的基础 , 而对于IDE , 很多团队都喜欢JupyterNotebooks和JupyterLab及其NB扩展 。

文章图片
而有些团队则是使用标准软件开发IDE , 提及最多的是Pycharm和VSCode 。
使用Pycharm的一家公司Hotelmize称 , 这是最好的PythonIDE 。
而使用VSCode的公司则为其正名 。
VSCode易于与Azure连接 , 并提供了许多基于ML的扩展 。对于使用R语言的团队来说 , RStudio是他们最好的选择 。
还有一项工具——GitHub 。 我想这对每个AI团队都是福音 , 初创公司更是 。
调查结果正是如此 , GitHub因为其免费、强大的版本控制系统、共享功能 , 对团队来说都是超级有用的 。
对于最流行的编程语言里 , Python、R语言上榜 , 竟还有一个Clojure 。
值得一提的是 , 对于环境/基础设施的设置方面 , 有一些团队给出了以下建议:
AWS作为部署平台(SimpleReport) 。
Anaconda是我们运行ML实验的首选工具 , 因为它的活代码功能 , 可以用来将软件代码、计算输出、解释性文本和多媒体资源结合在一个文档中 。 (Scanta)
Redis作为内存中的数据结构存储 , 由于它支持不同类型的抽象数据结构 , 如字符串、列表、映射、集、排序集、HyperLogLogs、位图、流和空间索引等 , 因此Redis作为内存中的数据结构存储占据了主导地位 。 (Scanta)
Snowflake和AmazonS3用于数据存储 。 (Hypergiant)
Spark-pyspark—-非常简单的api , 用于大数据的分配作业 。 (Hotelmize)
机器学习框架
机器学习框架也必不可少 。 而这一部分 , 选择的工具有很多 。

文章图片
在处理表格数据方面 , 最多提及的是Pandas 。
- 国际今日事|称“感觉好像中彩票”,美国男子在自家后花园发现一个大型游泳池
- 资讯早知道|9年后再看《步步惊心》,发现若曦无论跟谁都不会幸福
- 央视新闻客户端|宁夏首次在国际快件中发现易制毒化学品
- 【】河钢唐钢新区正式投产 河北钢铁产业区位调整取得关键性突破
- 央视新闻客户端|服贸会冬季运动专题引关注 冰雪产业进入发展快车道
- 央视网|直通服贸会 | 服贸冬季运动专题展:激发大众冰雪热情 助力冰雪产业发展
- 大众报业·海报新闻|海报时评丨推动新材料产业向更高端迈进
- 大众报业·海报新闻|山东新材料产业激活新动能——专访山东省新材料产业协会会长周传健,专访丨借鉴“华为模式”
- 宁夏首次在国际快件中发现易制毒化学品
- 服贸会冬季运动专题引关注 冰雪产业进入发展快车道
