组合相关话题

TOPIC

利用NVIDIA产品技术组合提升用户体验

2024-01-18

案例简介本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在NVIDIA V100 GPU上进行高效部署，帮助必优科技的文档智能体 UTalk-Doc 将用户指令识别服务吞吐量提升了 5 倍，单个请求响应时间缩减了三分之一，大幅提升服务运行效率，提升资源利用率。Triton 模型分析能力还协助必优科技，将寻找最佳推理配置所需的时间从数周减少到数小时。智能体迭代和用户增长的并发压力必优科技旗下 UTalk-Doc 是新

芯片资讯

共 1 页/1 条记录

组合 相关话题

利用NVIDIA产品技术组合提升用户体验

组合相关话题