DataFun
高小青:Impala在神策数据实时分析引擎中的落地与优化|DataFunTalk
导读:今天分享的主题是“Impala落地与优化:神策数据多维分析平台构建实战”,分为五个部分: 神策产品技术架构 基于Impala的实时分析引擎 查询性能优化 查询资源预估 未来计…
周冰倩:广告主视角下的信息流广告算法探索|DataFunTalk
广告主不能像广告平台一样,获取到比较多的用户维度的曝光数据,并且在广告主侧获取不到端外新用户的特征。本次分享会着重讲一下哈啰出行作为广告主,是如何在这些挑战下进行信息流广告算法建模…
李翔:美团到店综合知识图谱的构建与应用|DataFunTalk
美团到店综合业务涵盖了本地生活中的休闲玩乐、丽人、亲子、结婚、宠物等多个行业。为了不断提升到店综合业务场景下的供需匹配效率,美团深入挖掘用户在本地生活中的多样化需求,构建了以用户需…
张宗耀:bilibili每天100T+的数据导入是如何实现的|DataFunTalk
导读:B站千亿级数据同步,每天100T+数据导入是如何实现的?本文将介绍Apache SeaTunnel在哔哩哔哩的实践。包括以下几方面内容: 工具选择 日志 提速/限流 监控自理…
吴怡雯:腾讯数据湖元数据治理实践| DataFunTalk
导读:大家好,今天分享的主题是腾讯数据湖的元数据治理实践,跟大家一起聊聊腾讯云上DLC数据湖计算产品中统一元数据的设计思路和实践经验,希望能给大家带来一些参考。 本文的内容主要包括…
蒋能学:网易云音乐广告算法实践| DataFunTalk
导读:本次分享的主题为网易云音乐广告算法实践,内容围绕以下五个部分: 网易云音乐广告系统简介 广告点击率预估模型 广告转化率预估模型 用户向量建模与应用 总结与建议 网易云音乐广告…
京东算法工程师张菡:深度学习下的京东搜索召回技术| DataFunTalk
导读:搜索主要经历四个阶段:召回、粗排、精排和重排,最后呈现给用户最终的结果。而召回的结果主要来自两个部分:倒排检索和语义召回。传统的倒排检索依赖字面匹配,很难去召回一些语义相似但…
谷维:快手如何提升数据化管理效率|DataFunTalk
随着大数据时代的到来,数据对于每个企业,每个人来说都是极其重要的,淘宝通过数据可以给每个客户精准推荐商品,抖音通过数据可以记录每个用户的使用习惯。但同时,数据时代的到来,也让众多企…
Kevin:QQ音乐命名实体识别技术|DataFunTalk
导读:命名实体识别(Named Entity Recognition,简称NER)是自然语言处理中的热点研究方向之一,目的是识别文本中的命名实体,并将其归纳到相应的实体类型中。命名…
李茶:虎牙直播推荐系统架构详解|DataFunTalk
大家好,我叫李茶,来自虎牙直播的推荐工程组,主要负责虎牙直播的推荐架构工作。 直播推荐是一个头部主播比较集中的场景,比较注重关系链、词语以及长期的价值,业务诉求可能和其他推荐场景有…