github_trending_2025-07-14

1. farhanashrafdev/90DaysOfCyberSecurity

90天网络安全学习计划提供结构化自学路线,涵盖网络基础、安全原理、Linux、Python、流量分析、Git、ELK、云安全和渗透测试等核心内容。通过每日任务和丰富资源,帮助初学者系统掌握网络安全技能,适合转行人员或学生快速入门。项目特色在于整合认证考试内容和实战工具,形成完整学习闭环。


2. open-telemetry/opentelemetry-go

OpenTelemetry-Go是OpenTelemetry的Go语言实现,提供API和SDK用于收集应用性能指标、日志和追踪数据并发送至观测平台。支持OTLP、Prometheus等导出器,兼容主流Go版本,适用于构建云原生应用的分布式监控系统。


3. snap-stanford/Biomni

Biomni是一个通用生物医学AI代理,整合大型语言模型推理与检索增强规划技术,可自主执行CRISPR筛选、单细胞测序注释等多样化研究任务。其独特优势在于通过代码执行实现假设生成,显著提升科研效率。适用于生物医学研究人员,支持自然语言交互,提供11GB预训练数据湖。


4. psf/black

Black是Python代码格式化工具,采用极简主义设计,自动统一代码风格。它通过强制执行PEP 8规范,消除格式争议,提升代码一致性。特点包括:快速格式化、最小化diff输出、支持Jupyter Notebook,被Django、pytest等知名项目采用。适合团队协作开发,能显著节省代码审查时间。


5. getzep/graphiti

Graphiti是一个实时知识图谱框架,专为动态环境中的AI智能体设计。它支持实时增量更新数据、双时间数据模型和混合检索技术,能高效整合用户交互与企业数据,无需批量重算即可查询历史记录。适用于构建上下文感知的AI应用,提升智能体的状态推理和任务自动化能力。


6. zijie0/HumanSystemOptimization

《健康学习到150岁》是基于神经科学原理的人体系统调优指南,整合斯坦福教授Andrew Huberman的研究成果。项目提供睡眠优化、间歇性禁食、肠道菌群管理等科学方案,强调光照控制、体温调节等生物钟同步技术。适用于追求高效健康管理的技术人群,特色是将生理机制转化为可量化执行的”人体hack”方案,包含多巴胺管理、地中海饮食等前沿实践。


7. protocolbuffers/protobuf

Protocol Buffers是Google开发的跨语言数据序列化框架,支持多种编程语言,提供高效的结构化数据存储与交换方案。其核心优势包括语言中立、平台无关、高性能序列化,广泛应用于微服务通信和大规模分布式系统。开发者可通过.proto文件定义数据结构,并自动生成多语言代码。


8. ocrmypdf/OCRmyPDF

OCRmyPDF是一款命令行工具,为扫描版PDF添加可搜索的OCR文本层,支持多语言识别、自动纠偏、页面旋转等功能。基于Tesseract OCR引擎,可处理上百种语言,生成符合PDF/A标准的文件,优化后体积更小。适用于文档数字化、多语言PDF处理等场景,支持多核加速,确保数据隐私。


9. landing-ai/agentic-doc

LandingAI推出的Agentic Document Extraction是一个Python库,用于从复杂文档(如表格、图片、图表)中提取结构化数据,并输出层次化JSON和可渲染的Markdown。支持超长PDF(1000+页)、自动分页并行处理,内置错误重试和速率限制处理。适用于金融、法律等需要高效文档解析的场景,简化了API调用和批量处理流程。


10. pybind/pybind11

pybind11是轻量级C++/Python互操作库,通过头文件实现双向类型映射,支持C++11及以上标准。相比Boost.Python,它更精简高效,编译速度快且二进制体积小,特别适合为现有C++代码创建Python绑定。支持函数、类、STL容器、智能指针等特性,集成NumPy实现高效数据交换。适用于高性能计算、科学计算等需要混合编程的场景。


11. WordPress/wordpress-develop

WordPress官方开发镜像仓库,提供完整的Git同步版本,支持GitHub Codespaces云开发和本地Docker环境。包含PHP/MySQL/JavaScript技术栈,集成Node.js工具链,支持代码变更监听、WP-CLI命令执行和自动化测试。开发者可快速搭建WordPress开发环境,适用于核心贡献者和插件主题开发者。


12. Alibaba-NLP/WebAgent

阿里通义实验室推出的WebAgent系列,包含WebWalker、WebDancer和WebSailor三大组件,专注于复杂网络信息搜索任务。WebSailor-3B采用两阶段训练和独创的DUPO强化学习算法,在GAIA等基准测试中表现优异;WebDancer-32B基于ReAct框架实现自主信息搜索代理。适用于需要深度网络信息检索和复杂推理的场景,如智能问答和网络遍历。项目提供完整训练方法和开源模型,显著提升开源代理性能。


13. googleapis/genai-toolbox

MCP Toolbox for Databases 是一个开源数据库中间件,提供连接池、认证等基础设施,简化AI工具开发。支持自然语言查询数据库、自动化管理及代码生成,集成OpenTelemetry实现可观测性。适用于需要快速构建安全高效数据库AI助手的开发者,显著提升开发效率。


14. gorhill/uBlock

uBlock Origin是一款高效浏览器内容拦截器,支持Chromium和Firefox。它通过多源过滤列表(如EasyList、EasyPrivacy等)默认拦截广告、追踪器、挖矿脚本等威胁,同时保持低CPU和内存占用。特色包括可定制过滤规则、隐私保护优先设计,并提供基础/高级两种使用模式,是注重隐私和性能用户的理想选择。


15. odoo/odoo

Odoo是一套基于Web的开源商业应用套件,提供CRM、网站构建、电商、仓储管理、项目管理等一站式解决方案。采用模块化设计,各应用既可独立使用,也能无缝集成形成完整ERP系统。适用于中小企业数字化转型,具有开源灵活、功能全面、易于扩展等技术优势。