新芒x 1月15日消息 MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。
该系列模型以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,能够处理400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
新芒x 1月15日消息 MiniMax发布并开源新一代01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。
该系列模型以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,能够处理400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。