Together AI 是一个专注于开源人工智能的云平台,为企业和开发者提供模型 API 与算力服务。
Fireworks ai是一个专注于提供高效灵活且经济实惠的AI服务的平台。
谷歌TurboQuant算法实现重大突破,通过将AI模型缓存压缩至3-bit,使内存占用锐减至1/6,同时推理速度提升8倍,此举引发市场对存储芯片长期需求的担忧,导致相关存储巨头股价大幅下跌。