今天还想吃蛋糕编辑
-
chatgpt助力大数据数仓开发实践,效果惊艳
故事的开始是这样的,大数据开发删了几张表,过了2天才发现删错了,于是开发找我恢复表,我看了下数据还在回收站,问题不大。只需要建表,把所有的分区数据mv回去,然后msck…
-
涤生大数据HDFS小文件治理总结
随着大数据时代的到来,数据量不断增长,HDFS也成为了数据存储和处理的重要组成部分。然而,由于HDFS的设计原理和文件存储方式,HDFS系统中存在大量的小文件,这些小文件会导致HD…
-
运维常用的 34 个 Linux Shell 脚本,一定能帮到你!
来源:CSDN http://985.so/xyf7 作为一名 Linux 工程师,会写好的脚本不仅能提高工作效率,还能有更多的时间做自己的事。最近在网上冲浪的时候,也注意收集一…
-
马小阳:如何建设好的数据安全工具?
分享嘉宾:马小阳 产品经理 编辑整理:陈妃君 深圳大学 出品平台:DataFunTalk 导读:近年来,在信息技术支撑下,数据经济驱动着全球各经济体的经济总量不断增加,“数据安全”…
-
探秘微信业务优化:DDD从入门到实践
引言 | 本文作者从微信团队维护的带货类项目所遇卡点出发,尝试用领域驱动设计方法(简称DDD),保障在快节奏、多人协作的项目迭代中,维持系统的可维护性、可拓展性、高内聚低耦合和稳定…
-
元数据治理:产品方案介绍及案例实践
导读: 今天分享的主题是元数据治理实践,这是一项长期持续的工作,涉及多部门协作、多角色参与,链路长且复杂,要有完善的流程、成熟的平台、业务和技术部门共同参与,才能推进治理工作的有效…
-
Nacos 快速入门
1.预备环境准备 Nacos 依赖 Java 环境来运行。如果您是从代码开始构建并运行Nacos,还需要为此配置 Maven环境,请确保是在以下版本环境中安装使用: 64 bit …
-
一面数据: Hadoop 迁移云上架构设计与实践
? 作者简介: 刘畅,一面数据运维负责人,十五年程序老兵,计算机原理、算法、编程爱好者。 李阳良,一面数据大数据部门负责人,九年互联网工作经验,对后台开发、大数据技术接触比较多。 …
-
深入理解jvm和jvm基本调优参数
Java虚拟机原理 所谓虚拟机,就是一台虚拟的机器。他是一款软件,用来执行一系列虚拟计算指令,大体上虚拟机可以分为:系统虚拟机和程序虚拟机, 大名鼎鼎的Visual Box、Vma…
-
网易日志采集传输服务Datastream-ng的建设与优化
分享嘉宾:陈志辉 网易 数据平台开发工程师 编辑整理:段艺 腾讯 出品平台:DataFunTalk 导读:在互联网应用场景下,日志是常见的数据来源。高效、稳定的日志采集传输服务对于…
-
信通院闫树:隐私计算行业发展及合规发展思考
分享嘉宾:闫树博士 信通院 云大所副主任 编辑整理:毕东海 大连理工大学 出品平台:DataFunTalk 导读:本文将介绍关于隐私计算行业发展及合规发展的一些思考。主要包括以下几…
-
干货 | 从47%到80%,携程酒店APP流畅度提升实践
作者简介 Jin,携程高级研发经理,专注移动技术开发;Dan,携程测试开发经理,关注数据挖掘以及数据在系统质量提升中的应用;Lanbo,携程软件技术专家,专注移动技术开发。 一、…
-
基于人工智能技术的数据库未来发展方向
数据可以代表实际存在事物的信息,通过分析数据的形式将其细化出来。相比之下,知识则是一种概念和抽象信息,人们在看了之后掌握的是大范围的内容,而在看了数据之后则是了解的具体事物内容。一…
-
严选时序预测算法实践
时序预测算法在电商场景中有着大量的应用场景,基于严选的实际业务需求,我们开发沉淀了一套时序预测算法系统,实现了“数据-模型-服务”的完整链路,并落地于网易严选的补货、调拨、投放、搜…
-
火山引擎 AB 测试总体经济影响
Forrester 提出了客户时代的概念,在这个时代企业面临着愈发激烈的市场竞争以及不断提升的客户期望,而优化客户体验 (CX)对于赢得、服务和留住客户变得至关重要。这意味着公司必…
-
官宣|Apache Flink 1.15 发布公告
作者 | Joe Moser & 高赟 翻译 | 高赟 Apache Flink,作为 Apache 社区最活跃的项目之一[1],一直秉承积极开放的态度不断进行技术深耕。在…
-
在 Presto 中使用一致散列来改善Alluxio动态集群中的缓存数据局部性
使用 Alluxio 运行 Presto 在社区中越来越受欢迎。 它通过利用 SSD 或内存缓存靠近 Presto 工作人员的热数据集,避免了从远程存储读取数据的长时间延迟。 Pr…
-
Apache顶级项目Ranger和Alluxio的最佳实践(附教程)
介绍 Alluxio让计算引擎实现在任何云环境中的数据编排。Alluxio统一了本地和跨云环境下的数据孤岛,实现数据本地性、可访问性和弹性,从而降低大数据和人工智能/机器学习(AI…
-
通过SQL的解析与优化
本文讲述了通用SQL的解析与优化。
-
与视频和图像共同训练 Transformer 以提高动作识别
动作识别已成为研究界的主要关注领域,因为许多应用程序都可以从改进的建模中受益,例如视频检索、视频字幕、视频问答等。基于 Transformer 的方法最近展示了最先进的技术 在多个…