【创科广场】从BI走向AI Snowflake数据云无限伸延
2021-06-15 13:47
以往,企业建立数据仓库(Data Warehouse),提供各种业务分析报表,即所谓「商业智能」(BI)以帮助决策。
云端数据仓库,除了传统BI的洞察力,更结合大数据的分析,如今更配合AI,数据仓库上云,变成迟早的趋势。
去年上市的Snowflake,宣布与多家AI产业;包括Dataiku、H2O.ai、Tellius、DataRobot和ElectrifAi达成协议,伸延数据仓库功能,结合不同行业的AI机器学习模型,直接在Snowflake上执行。
如今市场慢慢意识,Snowflake不止是搞BI,实际上也搞AI。
即装即用AI模型
AI须依靠机器学习训练好的模型,能提供业务预测。市场上有多家初创,以SaaS形式提供即装即用的机器学习模型,可应用于业务系统。但模型如何与交易的数据整合,根据业务形势快速作应变,传统数据仓库架构连接AI,改动非常麻烦,数据云(Data Cloud)几乎是唯一出路。
Snowflake为建立于AWS或者Azure上云端数据服务,并开发出UDF和Snowpark,可执行Snowflake平台,以伸延系统未有内建或定义额外功能。
Snowpark可利用不同编程语言,变成客户端的逻辑,直接放入Snowflake数据仓库执行,包括进行ETL/ELT操作、数据预备,甚至执行AI模型。而UDF支援SQL和JavaScript语言,在虚拟化的数据仓库内整理数据格式,以供第三方系统取用。
上星期,Snowflake公布,计画收入从去年的5亿美元,2029财年之前增长至100亿美元。摩根士丹利形容Snowflake想法「史无前例」,过去从没软件公司预测的增长,可达到上述的速度。过去的3个月,Snowflake股价已回升3成,徘徊于240美元水平。
增长速度史无前例
Snowflake上市时,估值已超越独角兽,高达240亿美元;股东包括巴菲特及Salesforce.com,均一向无宝不落。
Snowflake属云端数据平台。不少人以为,企业最终会选择迁移数据仓库至云端上,原因是新技术层出不穷,数据量又愈来愈大,内部转移不便,部署云端则提供了灵活性,发挥数据的最大价值。内部数据仓库的技术,只可利用SQL建立OLAP的分析,却不能支援数据湖泊(Data Lake)等执行大数据分析,云上数据仓库早已风起云涌。
例如Azure Synapse和AWS RDS云数据库,数据仓库可快速建成数据湖泊,供大数据分析;但Snowflake更进一步,直接嵌入不同机器学习模型,以数据自动快速决策。Snowflake预测的业务增长,亦非全没根据。
小题:现成模型易于配置
市场上不少AI企业,专门训练出针对不同行业的机器学习AI模型,以ElectrifAi为例,成立于2004年,拥有200名数据科学家及软件工程师,具备1,000多个预建模型,适用于银行、金融服务、保险、电讯和零售业。
但是AI模型以不同语言开发,Snowpark简化数据仓库整合机器学习,不过估计各家公有云部很快有样学样,推出类似Snowpark整合服务。
不少模型对于企业甚有价值,以ElectrifAi模型ProcurementAi为例,可自动追踪合约内容,确保供应商按照合约提供货品服务,应付采购上的「长尾开支」(Tail Spend)难题,即是合约以外,采购时无法预计的附带开支。ElectrifAi也针对零售业准确预测供需的模型,以最低成本建立稳定存货量。Snowflake的Snowpark功能整合,ElectrifAi可轻易将预先建立机器学习模型库,与Snowflake数据云端整合,提供预测性分析,未卜先知。
關鍵字
最新回应