Microsoft Cognitive Toolkit 2.0 候选版本发布!

 Microsoft Cognitive Toolkit 2.0 候选版本发布!

Microsoft Cognitive Toolkit 原名 CNTK,是微软去年开源的深度学习框架。

作为语音识别领域声名卓著的开发工具,Microsoft Cognitive Toolkit 具有相当不错的可扩展性、速度和精确性。在海量数据上开发深度学习应用,它具备商用级别的稳定型,以及与主流编程语言与算法的兼容。

如今,它即将迎来新一代的 2.0 版本。

自从去年十月发布 2.0 beta 版,微软为 Microsoft Cognitive Toolkit 2.0 已陆续添加了超过 100 余个新特性、升级以及漏洞修补。而近日雷锋网获知,微软在 GitHub 上放出了它的 RC1版,即第一个候选版本,标志着内测阶段已经完成。

我们离 Microsoft Cognitive Toolkit 2.0 的正式发布又近了一步。

前天,微软在博客表示:

“我们很高兴地宣布,微软已经将 Microsoft Cognitive Toolkit 2.0 带出内测阶段,并在今天向大家公布其第一个候选版本。该工具此前被称为 CNTK,是一个针对深度学习的系统,用来加速诸如语音、图像识别以及搜索相关性(search relevance)等领域的技术进步。并可运行于 CPU 或英伟达 GPU。Microsoft Cognitive Toolkit 既可本地运行,也可在云端基于  Azure GPU 运行。

Microsoft Cognitive Toolkit 在一系列微软产品中都有十分广泛的应用。全世界范围内有大规模深度学习部署需求的公司,对最新算法、技术感兴趣的学生,都是其用户。自从 2016 年十月,我们已发布了超过十个 beta 版本,涵盖数百个新特性、性能提升和修补。”


主要升级

在 BrainScript 之外提供了更多 binding。2.0 版本把 Cognitive Toolkit 作为一个支持以下 binding 的算法库:

Python (versions 2.7, 3.4, and 3.5).

C++.

C#/.NET Managed.

Python 示例和教程(Jupyter Notebooks)

微软充分认识到 Python 在深度学习领域的重要性,准备了一系列 Python 示例与教程(后者作为 Jupyter Notebooks 来执行)。请见:

Python Examples.

Python Tutorials (Jupyter Notebooks).

雷锋网了解到,你也可以用 Cognitive Toolkit Docker Containers 来运行 Jupyter Notebooks 教程。

Layers

Layers 算法库得到了大幅升级。大量的通用“layers”已预定义,使编写包含标准层级的简单网络变得十分容易。

新的评估算法库

雷锋网(公众号:雷锋网)获知,新的 Cognitive Toolkit 评估算法库在易用性和性能上被大幅升级。该算法库可被用于 Windows 和 Linux,使用 C++、Python、C# 其它 .NET 语言。

新特性列表

  • The ability to extend Cognitive Toolkit functions, learners, trainers and optimizers with your own algorithms in Python, C++.

  • Enhanced, built-in distributed readers for speech, image, and text deep learning tasks.

  • The ability to use TensorBoard visualizations from Cognitive toolkit! Read more here.

  • Pretrained models available for use.

  • Performance improvements.

  • Support of distributed scenarios in Python API. See more in the sections on distributed scenarios in the ConvNet and ResNet examples.

  • Support of Asynchronous Stochastic Gradient Descent (ASGD)/Hogwild! training parallelization support using Microsoft’s Parameter Server (Project Multiverso).

  • Support for training on one-hot and sparse arrays via NumPy.

  • Support of object recognition using Fast R-CNN algorithm.

  • Integration with NVIDIA NCCL, a stand-alone library of standard collective communication routines, such as all-gather, reduce, broadcast, etc., that have been optimized to achieve high bandwidth over PCIe. See how to enable NCCL in the Cognitive Toolkit Wiki.

  • Lambda rank and NDCG at 1 are accessible from Python for real this time.

  • Performance Profiler for BrainScript and Python.

  • Support in training session for cross validation and preservation of all checkpoints.

Github 地址:https://github.com/Microsoft/CNTK

via microsofteweek

相关文章:

谷歌、微软、OpenAI 等巨头的七大机器学习开源项目 看这篇就够了

雷锋网版权文章,未经授权禁止转载。详情见转载须知

 Microsoft Cognitive Toolkit 2.0 候选版本发布!

(完)