热门 最新 精选 话题 上榜
Gemma 3 QAT是谷歌最新推出的量化优化开源模型,通过量化感知训练技术显著降低显存需求,同时保持高性能,使大模型能在消费级硬件上高效运行。
Aether是上海AI Lab开源的生成式世界模型,通过三维时空建模与生成式建模的深度融合,实现了4D动态重建、动作条件视频预测和目标导向视觉规划三大核心能力。
SimpleAR是复旦大学与字节Seed团队联合研发的自回归图像生成模型,仅用5亿参数即可生成1024×1024分辨率的高质量图像,在GenEval等基准测试中表现优异。
GigaTok是香港大学与字节跳动联合研发的3B参数视觉分词器,通过语义正则化技术和创新架构设计,解决了图像重建与生成质量间的矛盾,显著提升自回归模型的表示学习能力。
ImagePulse是魔搭社区推出的开源项目,通过构建原子能力数据集支持下一代图像理解与生成模型,包含修改、缩放、风格迁移等专项数据集。
SkyReels-V2是昆仑万维推出的突破性视频生成模型,基于扩散强迫框架和多模态大语言模型技术,支持生成理论上无限时长的连贯视频内容,在影视制作、广告创意等领域展现强大潜力。
OpenUtau是一款开源的歌声合成工具,兼容UTAU音源库和重采样器,支持多语言界面及预渲染功能,让音乐创作更加高效便捷。
TiDB 社区第四届专栏征文大赛✖️墨天轮火热开启! ? 两大赛道: TiDB 业务场景实战➕运维开发攻略,六大主题,等你来发挥! ? 参赛赢 BOSE 耳机、大疆手持云台、投影仪、小米手环、礼品卡 & TiDB 社区绝版周边
一、Linux安全基本概念(1)安全三要素(CIA模型):机密性(Confidentiality):通过文件权限(rwx)、加密技术(LUKS/GPG)和访问控制(SELinux)实现完整性(Integrity):使用校验和(md5sum/sha256sum)、文件监控(auditd)和数字签名机制可用性(Availability):通过RAID阵列、负载均衡和DDoS防护(iptables/Cl
在日常工作和学习中,经常需要整理思路和知识点,但传统的笔记方式总是显得混乱无序。想找一款好用的思维导图工具,却发现很多软件要么功能单一,要么需要付费,体验很不流畅。最近发现一款开源的 Web 思维导图工具:Simple mind map。软件免费下载地址:https://pan.quark.cn/s/14e74e86007e它功能强大、界面清爽,且完全开源免费,可以在线使用,也可以自部署,完美解决
原创 5月前
105阅读
再见 XMind !实用思维导图神器,效率翻倍!
FastAPI-MCP是一款能将FastAPI应用端点自动转换为符合模型上下文协议(MCP)的开源工具,支持零配置自动发现接口并保留完整文档和模式定义。
MineWorld是微软研究院基于《我的世界》开发的实时交互式世界模型,采用视觉-动作自回归Transformer架构,通过创新的并行解码算法实现每秒4-7帧的生成速度,在视频质量、可控性和推理速度上均超越现有模型。
斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。
微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型,通过后训练优化将敏感话题响应率提升至99.3%,同时将有害内容风险降低50%,保持原版推理能力并增强多语言支持。
InstantCharacter是腾讯混元团队基于扩散Transformer架构开发的开源图像生成工具,通过可扩展适配器和大规模角色数据集实现高保真、角色一致性的图像生成,支持单图输入和文本控制。
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
一、基本概念与核心价值1.1 什么是Firewalld?Firewalld 是 Linux 系统新一代动态防火墙管理工具,作为 iptables 的前端替代方案,其特点包括:动态规则管理:无需重启服务即可实时更新规则(对比传统iptables需要重载规则)区域(Zone)模型:通过预定义网络环境模板实现精细化管理D-Bus 接口:支持通过GUI工具(如firewall-conf
apiVersion: v1 kind: Namespace metadata: name: ingress-nginx labels: app.kubernetes.io/name: ingress-nginx app.kubernetes.io/instance: ingress-nginx --- # Source: ingress-nginx/templates/
原创 5月前
36阅读
k8s Ingress和 Ingress Controller
BlenderMCP通过MCP协议实现Blender与Claude AI的无缝集成,支持通过自然语言指令完成3D建模、材质调整等复杂操作,显著提升创作效率。
Codex CLI是OpenAI推出的轻量级AI编程智能体,基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制,支持代码生成、重构、测试及数据库迁移等功能。
字节跳动推出的豆包1.5·UI-TARS是首个整合视觉理解、逻辑推理与界面操作的GUI Agent模型,无需预定义规则即可完成复杂图形界面交互任务,已在火山方舟平台提供服务。
Kimina-Prover是由月之暗面与Numina团队合作开发的大型数学定理证明模型,采用强化学习训练,在Lean 4语言中严谨证明数学定理,在miniF2F基准测试中创下80.7%的新高成绩。
OpenAI最新推出的o4-mini小型推理模型在数学、编程和视觉任务中表现卓越,支持多模态推理和工具调用,性能超越前代的同时保持高性价比。
上海人工智能实验室开源的InternVL3系列多模态大语言模型,通过原生多模态预训练方法实现文本、图像、视频的统一处理,支持从1B到78B共7种参数规模。
Neural4D 2o是DreamTech推出的突破性3D大模型,通过文本、图像、3D和运动数据的联合训练,实现高精度3D生成与智能编辑,为创作者提供全新的多模态交互体验。
我们收到用户反馈问题中,多次反馈各种不同型号的屏幕驱动不起来,从0开始编写代码花费大量时间,也有不少初次学习驱动屏幕代码编写经验过少等问题,为此我们决定以文章的形式发布出来分享相应的一些经验以及收集整理好的资料,希望可以帮助用户更加简单的学习或快速移植代码进行项目开发。
Pollinations.AI 是一个开源的AI内容生成平台,提供免费的文本、图像、音频生成及转换API,无需注册即可使用,支持多种模型和自定义参数,适合开发者和创作者快速集成。
GLM-4-32B是智谱公司推出的320亿参数开源基座模型,基于15T高质量数据训练,在代码生成、逻辑推理和多模态处理方面表现优异,支持多种编程语言实时交互。
GLM-Z1-32B是智谱开源的32B参数推理模型,基于GLM-4-32B深度优化,在数学、代码和逻辑任务上表现卓越,推理速度高达200 tokens/s,支持轻量化部署和商用场景。
Magnitude是一个基于视觉AI代理的开源端到端测试框架,通过自然语言构建测试用例,结合推理代理和视觉代理实现智能化的Web应用测试,支持本地运行和CI/CD集成。