Transformers - 搜索 News

13 天

五年，终于等来Transformers v5

v5 版本将 PyTorch 确立为唯一核心后端，并聚焦于四大维度的进化：极致的简洁性、从微调迈向预训练、与高性能推理引擎的互操作性，以及将量化提升为核心功能。

Transformers来到了v5时代：从工具包到真理之源，AI时代的操作系统内核 ...

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！刚刚，Transformers v5 发布。它通过极简定义和极致互通，确立了自己作为 ...

13 天

五年磨一剑，Transformers v5重磅发布！

在人工智能领域，技术的演进如同波涛汹涌的大海，而在这片海域中，Transformers无疑是一艘引领风潮的巨轮。近日，全球最受欢迎的AI基础设施库——Transformers，终于迎来了它的最新版本——v5.0.0rc0。这一版本的发布标志着Transformers从v4到v5的五年技术周期的圆满结束，带来了众多激动人心的更新与变革。

10 天

华为Nexus架构：推理能力革命，Transformers时代的转折点

在当今人工智能的浪潮中，Transformer模型无疑是最具影响力的架构之一。然而，随着对复杂推理和数学问题的需求日益增加，传统的Transformer在处理多步逻辑推理时常显得力不从心。华为诺亚方舟实验室最近推出的全新架构——Nexus，正是为了解决这一痛点而生。

来自MSN

如何评价 Meta 新论文 Transformers without Normalization？

这篇文章有何恺明和杨立昆两位大佬坐镇，不由得让人重视。核心发现是：Transformer可以在不使用任何归一化层的情况下，通过简单的Dynamic Tanh（DyT）操作实现同等甚至更好的性能。训练深度神经网络时，每一层的输入的分布都在发生变化，这种现象被称为「 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果