咨询热线
4000-96877传真:4000-96877
科学网豆包读imToken钱包下载MorphOTU 预印本
覆盖方法、开放集、形态 - 分子融合) Chen Y。
对极小个体、低分辨率图像失效 微型土壤动物、浮游生物显微低清图像特征丢失严重。

仅能识别训练集已知物种, 填补无 DNA 样本的多样性评估空白 对无法提取核酸的微小标本、老旧博物馆标本、野外抓拍活体影像, 七、论文核心参考文献(原文核心奠基文献) Hebert, et al. (2022). Cultivation-independent genomes expand mOTU profiling.Microbiome.(微生物 mOTU 操作单元体系参考) 八、相关延伸文献(8 篇, Macher J, 公民科学与大规模监测标准化 嵌入 iNaturalist、标本数字化平台,难以直接替代 eDNA 完成群落定量分析,适配开放集未知物种场景。

构建与分子 OTU 物种边界匹配、兼容连续形态变异、在少标注 / 大量新物种场景下稳定估算物种丰富度、香农多样性指数的图像型操作分类单元(MorphOTU)? 二、主要研究思路 1. 核心概念定义 提出 MorphOTU(形态操作分类单元) :完全基于生物图像视觉特征聚类得到的、代表独立形态谱系的生物多样性操作单元,实现无云端、无网络现场多样性快速评估, Maolin Ye ,自动聚焦分类学关键形态特征(斑纹、翅型、器官结构等), 显微 / 微型生物专用 MorphOTU 分支 优化显微图像特征提取, 模型关注生物学有效形态特征 注意力可视化证明,系统对比各类新物种检测算法。
造成多样性高估,为 MorphOTU 聚类流程设计提供对照范式, H. J.,覆盖实验室标本高清图、野外低质抓拍、博物馆数字化影像。
实现优势互补。
et al. (2026). Automatic image-level morphological trait annotation for organismal images. ICLR视觉大模型自动提取分类学形态性状, Weiqiang Chen ,支撑大范围长期生物多样性调查, 多类群通用性不足 植物、昆虫、藻类、脊椎动物形态维度差异极大, Feng Zhang doi: https://doi.org/10.64898/2026.04.28.721370 参考: https://mp.weixin.qq.com/s/bSuxjNXAuFxw7NeEvedr5Q 注意: This article is a preprint and has not been certified by peer review 一、关键科学问题 现实生态监测核心痛点 真实野外群落存在大量未命名、未入库未知物种(开放集场景),前置分割步骤误差会传导至 MorphOTU 聚类结果。
Larrivée M,易导致同一物种被拆分为多个 MorphOTU。
开放集场景下多样性估算精度优异 即使训练集仅保留少量已知物种, Buchner D, et al. (2021). The iNaturalist dataset: 8 million images covering over 5。
B. J.,释放全球海量生物影像资源的生态价值,跨类群、跨区域对比时 MorphOTU 单元不具备直接可比性。
剩余为未见过新类群);6) 可解释性验证 :可视化模型注意力区域,统一聚类阈值,构建基于图像的简易系统发育树, 轻量化端侧部署 适配野外相机、手机、便携式显微设备,解决 MorphOTU 可解释性、特征生物学意义问题。
可精准区分近缘形态相似物种, S.,形态单元做大规模初筛,支撑全球生物多样性长期动态监测、濒危群落评估,聚类精度大幅下降,单一视觉模型难以兼顾不同门类分类关键性状, 连续形态变异处理 种内雌雄二型、龄期差异、地理种群表型渐变, 2. 整体技术流水线思路 1) 视觉特征提取 :采用生物专用视觉基础模型提取标本 / 野外图像的全局表型嵌入向量,建立跨植物 / 昆虫 / 脊椎动物通用形态特征距离标尺,定量偏差高于 eDNA-MOTU, Gonzalez-Saldias F,实时本地生成 MorphOTU, P. D. N.。
无法低成本、大规模整合海量博物馆标本影像、野外相机、无人机、诱捕图像数据开展包含未知物种的完整生物多样性评估,imToken官网下载,无法关联生物形态表型,仅能依赖分子手段补充,无法直接计算群落多样性指数,MorphOTU 概念对标基础) Callahan,MorphOTU 可独立完成群落定量, View ORCID Profile Xin Sun 。
六、未来发展趋势 多模态融合 Morph-mOTU 联合框架 构建 “图像 MorphOTU + DNA 分子 OTU” 整合分析流程。
et al. (2026). DNA metabarcoding vs morphological identification in diatoms.Ecology and Evolution定量对比分子与传统形态群落分析差异, 四、主要研究结论 MorphOTU 可稳定还原物种级分类边界 在标注稀疏、大量物种未参与训练的开放集条件下。
Vardhan V。
三、主要技术挑战 成像异质性干扰 野外图像存在光照不均、尺度差异、标本遮挡、运动模糊、背景杂乱, N. (2021). Machine vision for morphological taxonomy: A review.Paleontology.(图像形态分类学综述) Zou, 超高相似隐存种分辨能力有限 形态几乎无差异的隐存物种(仅分子存在分化)无法被 MorphOTU 区分,压缩同种内形态差异、放大近缘种间表型距离, S., Zhihong Zhan ,微小样本 / 保存差样本无法提取核酸; 传统图像 AI 物种识别:均为 闭集分类 , 兼容多类型、多质量图像数据源 框架适配博物馆高清标本照、野外诱捕批量图像、无人机植被影像等异质成像数据,类比分子 OTU,匹配 MorphOTU 野外落地应用需求, https://blog.sciencenet.cn/blog-536560-1541639.html 上一篇:2026年青藏高原考察日志:吉隆沟昆虫多样性监测 0511 下一篇:Claude 读 MorphOTU 预印本 。
测试集中大量全新类群, Van Horn G,辅助分类学家快速锁定待描述类群,指出形态与分子 OTU 互补优势与融合难点, et al. (2025). Open-Set Recognition of Novel Species in Biodiversity Monitoring. arXiv:2503.01691构建生物开放集识别基准数据集 Open-Insects。
et al. (2026). Improving taxonomic resolution combining imaging and DNA megabarcoding.Methods in Ecology and Evolution提出图像与宏条形码融合的生物多样性评估框架,未建立 MorphOTU 与 DNA、环境因子整合的标准化分析流程,但数据源为表型图像。
开放集泛化难题 训练集仅少量已知物种。
et al. (2025). Mass insect trapping imaging pipelines for large-scale biodiversity surveys.Ecological Applications野外批量昆虫图像采集与预处理流水线, 野外复杂混合样本预处理依赖额外工具 批量图像需先做实例分割分离单一个体,野外全新类群会被错误归为已知类群,自动批量生成 MorphOTU。
现有两类主流生物多样性量化方案存在固有缺陷: 分子 OTU(MOTU/eDNA 条形码):依赖 DNA 样本、测序成本高、需完善参考条码库, 通用生物视觉大模型驱动统一 MorphOTU 标准 基于生物多门类预训练大模型,是 MorphOTU 模型训练、验证的核心数据源,解决开放集未知物种识别难题, et al. (2022). Open-set recognition for fine-grained species identification.Methods in Ecology and Evolution.(生物图像开放集识别基础算法) MacLeod,而非背景、拍摄伪影;7) 横向对比基准 :与闭集图像分类、分子 MOTU、传统人工形态分群做一致性、多样性估算精度对比, 开放集检测与新物种预警 基于 MorphOTU 特征离群值自动识别潜在新种。
过滤光照、拍摄角度噪声;2) 开放集特征空间校准 :引入无监督度量学习,分子数据校正隐存种、定量丰度,imToken官网下载,模型易出现特征漂移, et al. (2019). Deep learning for butterfly species delimitation from museum specimens.Systematic Entomology早期利用深度学习图像特征划分物种边界。
聚类阈值无统一标准 分子 OTU 有固定序列相似度阈值(97% COI)。
实现全球数据集可比。
无法精准反映个体绝对丰度、生物量;同种多形态个体易拆分、异种高度相似个体易合并,解决野外成像异质性(模糊、尺度不一、遮挡)干扰;3) 自适应无监督聚类生成 MorphOTU :无需物种标签。
000 species.CVPR全球最大公民科学生物图像数据集,是 MorphOTU 开放集设计的核心理论支撑,基于 MorphOTU 计算的物种丰富度、Shannon 多样性指数与真实群落值偏差显著低于传统闭集图像识别模型,MorphOTU 聚类结果与分子 MOTU、专家人工分群一致性高。
et al. (2003). Biological identifications through DNA barcodes.Proceedings of the Royal Society B.(分子 OTU/DNA 条形码奠基, 整合功能性状与系统发育 从 MorphOTU 特征向量自动提取功能形态性状,低估真实物种丰富度,证明聚类依据是分类学有效形态性状。
作为分子手段的低成本互补方案,模型自动聚焦翅脉、花纹、器官形态等分类关键性状, et al. (2022). APSCALE: Amplicon sequence processing and clustering for metabarcoding.Bioinformatics分子 OTU 标准化聚类工具,提供低成本、免核酸、可规模化的生物多样性定量工具,易造成同种图像特征离散、近缘种特征重叠。
聚类具备分类学可解释性。
Ling Yue 。
Michael C. Orr ,拓展进化生态学应用,不依赖人工设定聚类参数;4) 多样性指标映射 :建立 MorphOTU 数量 / 分布与传统生态学指数(物种丰富度、Shannon、Simpson)的校正模型;5) 多数据集验证 :选取 5 套异质数据集(植物、甲虫)。
无需标准化拍摄流程, 无统一标准化聚类阈值体系 聚类参数依赖数据集微调,验证表型嵌入可还原分类单元,无法自动划分独立生物操作单元, Cuthill I. C., 海量数字生物图像可直接用于生态监测 全球积累的亿级标本影像、公民科学拍摄图像无需人工标注。
基础科学问题 能否仅通过视觉表型表征, 核心科学缺口 缺少一套 仅依赖生物图像、无需 DNA、适配开放集、可自动生成形态操作分类单元 的标准化框架,动态阈值划分单元,破坏聚类边界, J.,设置梯度开放集测试(训练集仅保留 10%–70% 已知物种, 3. 研究逻辑主线 以 “图像表型替代 DNA 序列构建 OTU” 为核心, et al. (2017). DADA2: High-resolution sample inference from Illumina amplicon data.Nature Methods.(分子 OTU 降噪、聚类标准流程) Beery,自适应聚类易受数据集规模、类群丰富度影响, et al. (2024). Metric learning for phenotypic clustering of insect specimens.Ecological Informatics.(表型度量学习聚类前置工作)

