腾讯 · 大数据SRE研发工程师 (已认证)
本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。
在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache K...
在两个集群在emr-header-1节点上,执行 hostname 命令获取hostname。在emr-header-1节点的/etc/krb5.conf文件中...
多个开启 kerberos 的 hadoop 集群之间要做通信(跨集群的数据迁移等),因为 Kerberos 原因无法正常进行,本文档说明了多 kerberos...
HiveServer2 服务默认不启用鉴权功能,这样的话随意输入密码都能连接上,容易造成安全隐患,下面讲解下如何配置Hiveserver2 的 Custom 鉴...
在EMR集群带公网master节点部署sentry服务,Impala的GROUP组需要在Impala server节点上进行创建系统组与之关联。
2022年,搜狐智能媒体完成了迁移腾讯云的弹性计算项目,其中大数据业务整体都迁移了腾讯云,上云之后的整体服务性能、成本控制、运维效率等方面都取得了不错的效果,达...
自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop...
腾讯科技有限公司 · 产品架构工程师 (已认证)
hadoop 的 kms的元数据是保存在本地的,比如加密的请求打到A,元数据保存在A机器上,如果解密的请求打到B机器上,就会失败。为了解决这个问题,使用cos作...
作者|吴建阳 翁建清 策划|褚杏娟 AWS Elastic MapReduce(以下简称 EMR) 是集齐数据接入、存储、计算、交互式查询、机器学习等一系...
归档,archive。Hive 具有内置支持,可将现有分区中的文件转换为 Hadoop 存档(HAR),这样一个曾经由 100 个文件组成的分区只能占用约 3 ...
涉及组件版本为:hdfs-3.2.2,yarn-3.2.2,openldap-2.4.44,spark-3.2.2,krb5-1.15.1
1月10日晚19:00,腾讯云大数据“数智话”技术沙龙 第四期《EMR&StarRocks携手共建云端开源大数据生态》直播圆满落幕。本次沙龙围绕腾讯云大数据沉淀...
注,本次使用腾讯云EMR的?StarRocks-V1.1.0? ,starrocks-2.2.2
这几天把跨年搞的和人生分水岭似的? 2023年的你有什么不一样了吗? 是不是还和去年一样的造型? 新姿(知)势(识),学起来 腾讯云开发者社区带着干货来了 腾讯...
1月10日晚19:00,腾讯云大数据“数智话”技术沙龙 第四期《EMR&StarRocks携手共建云端开源大数据生态》准时开启线上直播。本次沙龙围绕腾讯云大数据...
由于业务需要,添加了在hive原来的表上增加了新字段(alter table partition_test add columns(ads string); )...