在视频安防领域,监控摄像头和无人机积累了海量视频数据。这些数据通常仅在有明确目标需求时通过人工查看,成本高且效率低,导致大部分视频数据未被有效利用,长期处于“沉默”状态,甚至最终被销毁。为充分挖掘这些视频数据的价值,我们需要通过抽帧分析提取特征,并支持以自然语言检索视频数据,从而显著提升使用效率、降低成本。要实现这一目标,类似CLIP的模型是关键技术路径。本文主要研究模型的技术水平,帮助技术人员做方案决策。本文由 Deep Research with Gemini 2.5 Pro 撰写。

阅读全文 »

OpenAI 最近发布的《AI in the Enterprise》这份文档是OpenAI发布的一份企业级AI应用指南,旨在向企业介绍如何利用OpenAI的AI技术(特别是ChatGPT和相关模型)来提升业务效率、创新产品和服务,并应对企业级挑战。文档面向企业决策者、IT负责人和开发者,提供了AI在企业场景中的应用案例、技术实现路径以及部署建议。这份文档原版是英文,为了方便自己学习理解,我将其翻译成中文(利用各种LLM工具),并整理出这篇文章,分享给需要的人。本译文已经生成PDF,读者朋友们也可以直接下载AiInTheEnterprise中文翻译.pdf

AI in the Enterprise

阅读全文 »

OpenAI 最近发布的《A practical guide to building agents》白皮书是一份面向产品和工程团队的实用指南,旨在帮助他们理解如何设计、实施和扩展能够自主完成特定任务的 AI 智能体。这份 34 页的指南总结了 OpenAI 在实际部署智能体过程中积累的经验,提炼出了一系列可操作的最佳实践。这份白皮书原版是英文,为了方便自己学习理解,我将其翻译成中文(利用各种LLM工具),并整理出这篇文章,分享给需要的人。本译文已经生成PDF,读者朋友们也可以直接下载APracticalGuideToBuildingAgents中文翻译.pdf

a-practical-guide-to-building-agents

阅读全文 »

谷歌近日发布了一份长达 68 页的白皮书,系统阐述了提示工程(Prompt Engineering)的核心理念与最佳实践。这份白皮书原版是英文,为了方便自己学习理解,我将其翻译成中文(利用各种LLM工具),并整理出这篇文章,分享给需要的人。需要注意的是,我是基于Google官方提示工程原版网站提供的v7版本pdf进行翻译。本译文已经生成PDF,读者朋友们也可以直接下载PromptEngineering中文翻译.pdf

whitepaper-prompt-engineering

阅读全文 »

在 ToG 领域的业务系统,Huawei Atlas NPU 占领了非常大的市场份额,很多公司因各种各样的原因,也纷纷选择兼容 Atlas NPU 的方案。但是,Huawei Atlas NPU 价格并不便宜,很多研发团队在项目开始时通过某些渠道申请到华为的测试机资源,当完成研发测试后,便返还给对方,自己并没有华为的硬件平台。笔者遇到了一个问题,就是项目中使用到的 om 模型,推理出来的结果有问题,需要重新使用 ATC 工具对 onnx 模型进行重新转换。但是在我们研发的资源里面,并没有华为平台的硬件资源,没法使用华为公开的镜像运行 ATC 命令行工具。本文将介绍如何构建一个在非华为设备上运行 ATC 命令行工具的镜像。

阅读全文 »
0%