大数据时代,录信数软助力数据价值挖掘
本篇文章2173字,读完约5分钟
大数据技术近年来日趋成熟,在民生领域发挥着越来越重要的作用。特别是在今年的COVID-19疫情中,相关机构应用大数据技术,收集和处理了空航空、铁路、公路等交通部门的出行数据。,并在用户授权的前提下,从中国移动、中国联通和中国电信三大运营商获取用户手机的位置信息,并进行统计分析,从而跟踪个体的运动轨迹,建立个体关系图,准确定位疫情传播路径。
随着移动互联网和通信技术的快速发展,数据信息的分发和应用越来越广泛。对于政府和企业来说,数据库已经成为决定发展方向的重要因素和信息转化的重要基础。据idc预测,到2020年底,全球数据量预计将达到44 zb,中国的总数据量将达到8060 eb,占全球数据量的18%。海量数据带来了许多挑战和机遇。数据不仅需要在成本可控的前提下进行有效存储,还需要通过强大的工具进行灵活的搜索、统计和分析,以充分挖掘数据的价值。
本文中的图片来自录音软件,并经过授权使用。
卢鑫数码软件(南京卢鑫软件技术有限公司)成立于2018年。其核心团队在大数据检索和分析领域积累了10多年经验,致力于大数据行业数据库软件的自主研发。在中国推动新基础设施战略、本地化替代和基础软件领域发展的背景下,信息记录软件基于lucene和hadoop技术栈,在海量数据的即时检索和多维聚合分析领域为众多行业提供低成本、高价值的大数据应用支持服务。
目前,软件团队约有20人,大部分来自国内知名企业,如阿里、腾讯、ibm、富士通、烽火等。,而R&D的技术人员占60%。首席技术官的创始人之一马延年于2006年加入新浪,第一次接触搜索领域,并产生了浓厚的兴趣。出于对lucene(全文搜索框架)的热情,他在2011年加入了阿里,并提出了将大数据与全文检索相结合的想法。他参与或领导了支付宝黄金政策高层和开源项目mdrill(多维分析);加入腾讯后,他参与了腾讯的爱马仕(hermes)等项目,并拥有数百万亿和数千亿项目的设计和实施经验。谈到创业的初衷时,穆延年说:“除了腾讯的业务场景,我们认为还有很多更好的应用场景等着我们去探索和实践。帮助更多企业灵活使用数据信息,推动企业数字化转型,也是我们最大的初衷。因此,我们最终选择了创业之路。”
随着数据量的爆炸式增长,传统的关系数据库已经无法应对海量数据的olap(联机分析处理)场景,而基于hadoop分布式存储和计算系统的各种技术正在蓬勃发展。然而,目前对于各种场景的大数据检索和分析,如全文检索、查询统计、预计算、流量计算等。,多个系统需要组合使用,这导致数据扩展速率高,操作和维护困难。对于缺乏技术能力的组织来说,有必要建立一个技术团队,以便发现他们手中的数据的价值,而且时间和经济成本都非常高。
鉴于行业中的棘手问题,lsql(一种准通用的全堆栈数据库产品)和鲁迅(一种数据库一体机)已被开发出来,以实现数据量、灵活性和性能之间的平衡。在降低数据膨胀率、提高系统可用性和节约综合成本的基础上,可以在几秒钟内检查数万亿的数据。
本文中的图片来自录音软件,并经过授权使用。
与同行业的头产品es(弹性搜索)相比,lsql记录的消息数量较少,在使用成本、存储规模和个性化方案定制方面得到了进一步优化。马延年说:“为了保证更高的性能,es需要使用读写速度更快的sas磁盘或ssd磁盘来存储数据,但sas磁盘或ssd磁盘比普通sata磁盘更贵,而且单个磁盘的存储容量更小。”例如,容量为900gb的sas磁盘的价格与容量为8tb的sata磁盘的价格相似,这导致es的硬件成本显著增加。Lsql采用列簇冷热分离技术,可以通过ssd加速热数据,并在后期自动迁移到sata磁盘。企业对此并不知情,成本可以成倍降低。”此外,针对子行业的个性化定制版本lsql已广泛应用于公安、交警、军事、汽车等行业。
目前,卢鑫正在开发新一代hsql产品。与第一代产品lsql相比,hsql的应用范围更广,涵盖了olap和搜索领域,可以取代传统的数据仓库(hive、spark sql)和kv数据库。“hsql不仅是es的替代品,也是其他大数据组件的集成。与行业中简单的框架集成不同,hsql深入底层,重构和兼容每个组件的源代码,实现hsql的独特特性,而上层调度和封装每个框架接口,实现功能集成,最终通过一个接口实现一个数据。多次使用不需要在每个系统中独立存储数据。”谈到新产品时,穆延年说。
软件录制的业务模式主要是软件许可费、服务费、定制费和一体机销售。每90天更新一次版本的平均速度确保用户和合作伙伴可以享受最新的产品功能。凭借产品和服务的优势,卢鑫数字软件2019年的合同收入将达到数千万,并且将实现盈利。2020年受疫情影响,总收入预计在2000万左右。
2020年4月初,卢鑫数码软件披露了由凯丰风险投资公司投资的第一轮种子融资。融资主要用于新产品的研发。目前,新产品hsql的研发已接近尾声,并拥有部分种子用户,但尚未投放市场。“预计在今年第三季度,我们将进行新一轮融资,用于新产品和外围产品的改进、团队扩展和营销。”延年妈妈介绍。
本文中的图片来自录音软件,并经过授权使用。本文由创业邦原创,未经授权不得转载,否则创业邦将保留追究其法律责任的权利。如果您需要重印或有任何问题,请联系编辑@cyzone。
标题:大数据时代,录信数软助力数据价值挖掘
地址:http://www.huangxiaobo.org/hqxw/104945.html
免责声明:环球商业信息网为互联网金融垂直领域下的创投、基金、众筹等项目提供信息资讯服务,本站更新的内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,环球商业信息网的编辑将予以删除。