Beebeam | 文字、图像识别及AI

与对话

行业资讯

独角兽Databricks收购大数据平台Okera

OpenAI估值290亿美元：新一轮融资完成

英伟达最「闪」GPU 登场

人工智能要普及，这一步必须要先行

腾讯发布机器人灵巧操作研究成果

AI作画，如何实现AIGC的价值

熔岩羊驼LLaVA来了

由chat GPT带起的AI浪潮正在席卷全球，影响着所有的行业，也包括数据库领域。据TechCrunch报道，数据库领域独角兽Databricks 宣布收购了专注于 AI 的数据治理平台 Okera。虽然两家公司均未透露收购价格，从Crunchbase 的数据来看，Okera 此前筹集了近 3000 万美元，投资者包括 Felicis、Bessemer Venture Partners、Cyber Mentor Fund、ClearSky 和 Emergent Ventures。 Databricks 在今天的公告中指出，数据治理已经是一个热门话题，但最近对 AI 的关注凸显了以前处理它的方法的一些缺点。 “从历史上看，数据治理技术，无论其复杂程度如何，都依赖于在一些狭窄的腰层实施控制，并要求工作负载适应这一层的‘围墙花园’，”该公司在一篇博文中解释道。这种方法在大型语言模型 (LLM) 时代不再适用，因为资产数量增长太快（部分原因是其中大部分是机器生成的）并且因为整体 AI 格局变化如此之快，标准访问控制无法足够快地捕获这些更改。由于行业的垂直，Databricks的产品和核心业务，仍然只有一小部分的VC、数据科学家有所了解。事实上，数据库市场是一个千亿美元、年同比增长达两位数的吸金兽。该如何理解Databricks？在互联网风靡之前，我们的大部分数据还保存在 Excel 电子表格中时，这并不难：写几个VBScript就足够了。现在，我们的每一个YouTube视频观看事件——开始、暂停、跳过广告等，都被收集、解析、聚合，最终变成某个高管屏幕前的柱状图。而这一切，很可能时刻都在发生。每家拥有数据的公司，希望实现的一个终极目标是：搭建一个自动化系统，将原始数据集源源不断地转化为业务价值。换句话说，一个自动将“数据变现”的系统。从本质上讲，Databricks是一家计算公司，通过解决两个关键问题：如何使用数据；如何把数据从源头向下游汇集和转化，提出了一种搭建数据流水线的低代码解决方案。归根究底，Databricks 是一家提供“计算”的公司。与该类别的其他公司一样，它通过租出服务器的计算资源来赚钱。 AI的出现凸显了以前一些数据处理方法的缺点，正如 Databricks 团队强调的那样，这是该公司有兴趣收购 Okera 的原因之一，但另一个原因是该服务的隔离技术，它可以在没有任何重大开销的情况下对任意工作负载实施治理控制。这项技术仍处于私人预览阶段，但可能是 Databricks 收购该公司的主要原因之一。 Databricks 几周前推出了自己的 LLM，计划将 Okera 的技术整合到其现有的数据和 AI 资产治理解决方案 Unity Catalog 中。该公司还指出，此次收购将使 Databricks 能够公开额外的 API，其自己的数据治理合作伙伴将能够使用这些 API 为其客户提供解决方案。通过此次收购，Databricks 还邀请了 Okera 联合创始人兼首席执行官李农。 Li 创建了 Apache Parquet 数据存储格式，在 Cloudera 工作和创办 Okera 之前，他实际上曾在 Databricks 短暂担任工程师，他是 Okera 的创始首席技术官，并于 2022 年 2 月成为首席执行官。

敲黑板

人工智能（Artificial Intelligence）是指通过计算机
模拟人类智能的理论、方法、技术和应用系统。通
俗来说，AI 是计算机科学的一个分支，旨在研究如
何让计算机能够像人一样思考、学习、推理、识别、
理解和处理各种任务，从而实现更加智能化和自动
化的应用。

OCR&IR

文字和图像识别是人工智能技术中的一种，它可以
通过计算机视觉和自然语言处理等技术实现对文字
和图像的自动识别。文字识别（OCR）可以将印
刷体、手写体等各种形式的文字转换成计算机可处
理的文本数据。例如，将一张纸质的发票或者名片
扫描后，通过 OCR 技术可以将其上面的文字识别
出来，并转换成电子文本格式，方便存储和管理。
图像识别（Image Recognition）则是将图像中的物
体、人脸、场景等进行识别和分类。例如，将一张
照片中的猫、狗等动物识别出来，或者将一幅画中
的不同物体进行分类。图像识别常用于图像搜索、
智能监控、无人驾驶等领域。这些技术都是基于机
器学习和深度学习等算法实现的，需要通过大量的
数据训练模型，不断优化算法，才能提高识别准确
率和效率

AI模型分类及应用

● 传统机器学习模型：包括逻辑回归、决策树、支持向量机、朴素贝叶斯等模型，主要应用于分类、回归等任务。
● 深度学习模型：包括卷积神经网络、循环神经网络、生成对抗网络、变分自编码器等模型，主要应用于图像识别、自然语言处理、语音识别等任务。Open AI的ChatGpt和Google Brain就是卷积神经网络，而AI绘画的Midjourny底层是生成对抗网络。
● 强化学习模型：包括Q-learning、Deep Q-Network、Actor-Critic等模型，主要应用于机器人控制、游戏AI等任务。我们的AI AutoRun使用的就是Deep Q-Network模型。
● 迁移学习模型：包括预训练模型、领域自适应模型等，主要应用于数据集较小、训练时间较短等场景下的任务。自监督学习模型：包括自编码器、对比学习等，主要应用于无标签数据集的任务

人工智能的应用前景非常广泛，它可以应用于许多不同的领域：
● 医疗领域：医生更准确地诊断疾病、提高医疗效率、预防疾病、定制化治疗等。
● 金融领域：金融机构更好地分析和预测市场趋势、风险评估、作出投资决策等。
● 制造业领域：提高生产效率、减少生产成本、提高产品质量等。
● 交通领域：更好地管理和控制交通流量、提高交通安全等。
● 能源领域：管理和控制能源供应、提高能源效率、减少能源消耗等。
● 农业领域：管理和控制种植和养殖过程、提高农业效率、减少资源浪费等。
● 教育领域：定制化教学、提供个性化教育、提高教育效率等。
● 游戏领域：制作游戏、提高游戏体验、减少游戏痴迷等。