Lewlh's blog

CLIP类模型在安防监控视频图像自然语言检索应用中的性能分析报告

发表于 2025-05-14 更新于 2025-05-20

在视频安防领域，监控摄像头和无人机积累了海量视频数据。这些数据通常仅在有明确目标需求时通过人工查看，成本高且效率低，导致大部分视频数据未被有效利用，长期处于“沉默”状态，甚至最终被销毁。为充分挖掘这些视频数据的价值，我们需要通过抽帧分析提取特征，并支持以自然语言检索视频数据，从而显著提升使用效率、降低成本。要实现这一目标，类似CLIP的模型是关键技术路径。本文主要研究模型的技术水平，帮助技术人员做方案决策。本文由 Deep Research with Gemini 2.5 Pro 撰写。

阅读全文 »

OpenAI《AI in the Enterprise》中文翻译

发表于 2025-05-06 更新于 2025-05-20

OpenAI 最近发布的《AI in the Enterprise》这份文档是OpenAI发布的一份企业级AI应用指南，旨在向企业介绍如何利用OpenAI的AI技术（特别是ChatGPT和相关模型）来提升业务效率、创新产品和服务，并应对企业级挑战。文档面向企业决策者、IT负责人和开发者，提供了AI在企业场景中的应用案例、技术实现路径以及部署建议。这份文档原版是英文，为了方便自己学习理解，我将其翻译成中文（利用各种LLM工具），并整理出这篇文章，分享给需要的人。本译文已经生成PDF,读者朋友们也可以直接下载AiInTheEnterprise中文翻译.pdf

AI in the Enterprise

阅读全文 »

OpenAI构建智能体的实用指南中文翻译

发表于 2025-04-22 更新于 2025-05-20

OpenAI 最近发布的《A practical guide to building agents》白皮书是一份面向产品和工程团队的实用指南，旨在帮助他们理解如何设计、实施和扩展能够自主完成特定任务的 AI 智能体。这份 34 页的指南总结了 OpenAI 在实际部署智能体过程中积累的经验，提炼出了一系列可操作的最佳实践。这份白皮书原版是英文，为了方便自己学习理解，我将其翻译成中文（利用各种LLM工具），并整理出这篇文章，分享给需要的人。本译文已经生成PDF,读者朋友们也可以直接下载APracticalGuideToBuildingAgents中文翻译.pdf

a-practical-guide-to-building-agents

阅读全文 »

Google提示工程中文翻译

发表于 2025-04-15 更新于 2025-05-20

谷歌近日发布了一份长达 68 页的白皮书，系统阐述了提示工程（Prompt Engineering）的核心理念与最佳实践。这份白皮书原版是英文，为了方便自己学习理解，我将其翻译成中文（利用各种LLM工具），并整理出这篇文章，分享给需要的人。需要注意的是，我是基于Google官方提示工程原版网站提供的v7版本pdf进行翻译。本译文已经生成PDF,读者朋友们也可以直接下载PromptEngineering中文翻译.pdf

whitepaper-prompt-engineering

阅读全文 »

构建在非华为设备上运行的HuaweiAtlasATC镜像

发表于 2025-04-02 更新于 2025-04-15

在 ToG 领域的业务系统，Huawei Atlas NPU 占领了非常大的市场份额，很多公司因各种各样的原因，也纷纷选择兼容 Atlas NPU 的方案。但是，Huawei Atlas NPU 价格并不便宜，很多研发团队在项目开始时通过某些渠道申请到华为的测试机资源，当完成研发测试后，便返还给对方，自己并没有华为的硬件平台。笔者遇到了一个问题，就是项目中使用到的 om 模型，推理出来的结果有问题，需要重新使用 ATC 工具对 onnx 模型进行重新转换。但是在我们研发的资源里面，并没有华为平台的硬件资源，没法使用华为公开的镜像运行 ATC 命令行工具。本文将介绍如何构建一个在非华为设备上运行 ATC 命令行工具的镜像。

阅读全文 »