emr - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签emr

#emr

「EMR 开发指南」之 Sqoop 使用说明

岳涛

腾讯云｜大数据SRE研发工程师 (已认证)

2025-04-302025-04-30 16:23:41

Sqoop是一种用于在Apache Hadoop和结构化数据存储（如关系数据库）之间传输数据的开源工具。它允许用户在Hadoop分布式文件系统（HDFS）和外部...

19720

腾讯云EMR Serverless HBase上线：全托管服务，开箱即用

腾讯QQ大数据 2025-03-242025-03-24 13:59:21

在大数据体系中，HBase是一个非常重要的组件，主要用于处理和存储海量结构化和非结构化数据。HBase广泛应用于个性化推荐画像、订单存储、车辆轨迹查询、物联网传...

20810

MNode大揭秘！腾讯云EMR如何实现免运维与计算成本降本超30%

腾讯QQ大数据 2024-09-112024-09-11 17:17:12

当前腾讯云 EMR 集群主要采用 HOST 资源部署， HOST 具备按需使用、易于部署与维护、高度灵活性以及企业自主性强等优势。然而，这要求企业运维人员具备熟...

20410

腾讯云EMR智能洞察：让大数据应用分析更“Easy”

腾讯QQ大数据 2024-08-112024-08-11 16:05:51

随着企业数据规模的不断增长，人工方式分析大数据平台的计算任务、存储和调度性能已经无法满足业务要求。面对每天数以万计的计算任务和海量的存储数据，传统人工分析不仅会...

37510

「EMR 开发指南」之 Hue 配置工作流

岳涛

腾讯云｜大数据SRE研发工程师 (已认证)

2024-07-302024-07-30 19:55:34

本文将通过一个简单，并且具有典型代表的例子，描述如何使用EMR产品中的Hue组件创建工作流，并使该工作流每天定时执行。

29721

【每日精选时刻】一个 url 就把人家网站克隆了？入行15年，我还是觉得编程很难；快速部署FastGPT私人助理

社区好文捕手-煎饼狗子 2024-03-062024-03-06 09:05:32

大家吼，我是你们的朋友煎饼狗子——喜欢在社区发掘有趣的作品和作者。【每日精选时刻】是我为大家精心打造的栏目，在这里，你可以看到煎饼为你携回的来自社区各领域的新鲜...

71772

「EMR 开发指南」之 Oozie 作业调度

岳涛

腾讯云｜大数据SRE研发工程师 (已认证)

2023-11-302023-11-30 18:28:39

本文将使用oozie组件自带的例子，详细介绍如何在oozie workflow上提交一个MapReduce jar。本文以oozie 4.3.1版本为例。

22420

「EMR 开发指南」之 Kylin 存算分离方案

岳涛

腾讯云｜大数据SRE研发工程师 (已认证)

2023-11-292023-11-29 23:05:25

在大数据领域，数据量持续增长，数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题，Apache K...

40921

「EMR 运维指南」之 Kylin 迁移方案

岳涛

腾讯云｜大数据SRE研发工程师 (已认证)

2023-11-282023-11-28 19:04:52

53431

腾讯QQ大数据 2023-08-142023-08-14 14:30:57

2022年，搜狐智能媒体完成了迁移腾讯云的弹性计算项目，其中大数据业务整体都迁移了腾讯云，上云之后的整体服务性能、成本控制、运维效率等方面都取得了不错的效果，达...

56950

自建大数据平台迁移腾讯云EMR最佳实践

腾讯QQ大数据 2023-07-262023-07-26 21:36:22

自建开源大数据平台会随着企业数据的增长遇到：性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop...

70220

基于cos的hadoop KMS HA部署

王旭平

腾讯科技有限公司｜产品架构工程师 (已认证)

2023-05-092023-05-09 11:22:51

hadoop 的 kms的元数据是保存在本地的，比如加密的请求打到A，元数据保存在A机器上，如果解密的请求打到B机器上，就会失败。为了解决这个问题，使用cos作...

80081

EMR 实战心得浅谈

深度学习与Python 2023-03-292023-03-29 16:46:31

作者｜吴建阳翁建清策划｜褚杏娟 AWS Elastic MapReduce(以下简称 EMR) 是集齐数据接入、存储、计算、交互式查询、机器学习等一系...

2.5K10

hive 处理已经存在的小文件方案

王旭平

腾讯科技有限公司｜产品架构工程师 (已认证)

2023-07-042023-07-04 14:49:53

归档，archive。Hive 具有内置支持，可将现有分区中的文件转换为 Hadoop 存档(HAR)，这样一个曾经由 100 个文件组成的分区只能占用约 3 ...

9K60

自建迁移EMR实践案例

腾讯云大数据 2024-06-132024-06-13 16:50:54

3.9K140

#emr

「EMR 开发指南」之 Sqoop 使用说明

腾讯云EMR Serverless HBase上线：全托管服务，开箱即用

MNode大揭秘！腾讯云EMR如何实现免运维与计算成本降本超30%

腾讯云EMR智能洞察：让大数据应用分析更“Easy”

「EMR 开发指南」之 Hue 配置工作流

【每日精选时刻】一个 url 就把人家网站克隆了？入行15年，我还是觉得编程很难；快速部署FastGPT私人助理

「EMR 开发指南」之 Oozie 作业调度

「EMR 开发指南」之 Kylin 存算分离方案

「EMR 运维指南」之 Kylin 迁移方案

「EMR 开发指南」之 Kylin 快速构建 Cube

「EMR 运维指南」之 Kerberos 跨域互信配置

「EMR 运维指南」之 Kerberos 跨域认证方案

「EMR 运维指南」之 HiveServer2 启用 Custom 鉴权

「EMR 运维指南」之 Impala 关联 Sentry + Hue

搜狐智能媒体基于腾讯云大数据 EMR 的降本增效之路

自建大数据平台迁移腾讯云EMR最佳实践

基于cos的hadoop KMS HA部署

EMR 实战心得浅谈

hive 处理已经存在的小文件方案

自建迁移EMR实践案例

热门专栏

公有云大数据平台弹性 MapReduce

腾讯大讲堂的专栏

超级架构师

大数据-Hadoop、Spark

QQ大数据团队的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐