“结构化与非结构化之间,相比存储方式的不同,更重要的是读取、分析、处理的工具不同。

当我从一个人的信息能准确拿到姓名时,姓名相对于一个人的信息来说,是结构化的。当我还要继续拆解出姓和名的时候,姓名是一个整体,它是非结构化的。所以是否结构化不是绝对的,看相对于什么而言,看你想拆解到哪种程度。

数据库中可以存一篇纯文本文章,这种可以看作是非结构化存在结构化之中。而图片文件这种非结构化的数据,它本身也有一定的结构。你中有我,我中有你,才是它们的实际关系。”

结构化数据、非结构化数据之我的理解

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐