极兔快递单号快速查询:Hive查询快速查找表大小(行数)(hive check table size)

是否有一个 Hive 查询来快速查找表大小(即行数),而无需启动耗时的 MapReduce 作业?(这就是为什么我想避免COUNT(*)。)

我尝试了DESCRIBE EXTENDED,但产生了numRows=0这显然是不正确的。

(为 newb 问题道歉。我试过 Google 搜索和搜索 apache.org 文档没有成功。)

42

tblproperties 将给出表的大小,如果需要,可以用来获取该值。

-- gives all properties
show tblproperties yourTableName
-- show just the raw data size
show tblproperties yourTableName("rawDataSize")
29

这里是快速命令

ANALYZE TABLE tablename [PARTITION(partcol1[=val1], partcol2[=val2], ...)] COMPUTE STATISTICS [noscan];

例如,如果表已分区

 hive> ANALYZE TABLE ops_bc_log PARTITION(day) COMPUTE STATISTICS noscan;

输出是

分区 logdata.ops_bc_log {day = 20140523} 统计信息:[numFiles = 37,numRows = 26095186,totalSize = 654249957,rawDataSize = 58080809507]

分区 logdata.ops_bc_log {day = 20140521} 统计信息:[numFiles = 30,numRows = 21363807,totalSize = 564014889,rawDataSize = 47556570705]

分区 logdata.ops_bc_log {day = 20140524} 统计信息:[numFiles = 35,numRows = 25210367,totalSize = 631424507,rawDataSize = 56083164109]

分区 logdata.ops_bc_log {day = 20140522} 统计信息:[numFiles = 37,numRows = 26295075,totalSize = 657113440,rawDataSize = 58496087068]

11

如何使用:

    hdfs dfs -du -s -h /path/to/table/name
1

解决方案,虽然不是快速的
如果表是分区的,我们可以计算分区的数量和每个分区中的计数(行数)。
例如:,如果按日期分区(mm-dd-yyyy)

select partition_date, count(*) from <table_name> where <partion_column_name> >= '05-14-2018' group by <partion_column_name>

本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处

(604)
Sip服务器:c# sip服务器创建(sip pbx server)
上一篇
Cl是什么单位等于多少ml:在bootstrap4中ml的含义是什么
下一篇

相关推荐

  • docker游戏服务器:如何使用Docker搭建高性能的游戏服务器

    Docker游戏服务器是一种将游戏服务器部署到容器中的方式,它可以帮助游戏开发者快速、轻松地部署游戏服务器,并且可以更轻松地扩展游戏服务器的容量。…

    2023-04-27 09:55:33
    0 10 39
  • win7玩cf卡顿怎么解决:解决Win7环境下CF游戏卡顿问题

    尝试更新系统:可能是由于系统缺少某些补丁或者更新导致CF卡顿,可以尝试在Windows Update中进行检查更新,并安装最新的补丁和更新。更新显卡驱动:可能是由于显卡驱动过旧或者不兼容导致CF卡顿,可以尝试更新显卡驱动,可以到显卡厂商官网下载最新的驱动进行安装。…

    2023-05-27 11:45:17
    0 73 51
  • cv糖醋排骨是弯的吗弯曲的美味

    cv糖醋排骨不是弯的,它是一种制作方法,通常用来制作排骨。代码:…

    2023-04-01 13:03:36
    0 72 50
  • java ee eclipse使用:如何使用Java EE Eclipse来开发Web应用

    示例示例Java EE Eclipse使用步骤:安装Eclipse IDE。…

    2023-10-12 04:51:32
    0 36 39
  • cookie如何使用:如何使用Cookie来改善用户体验

    Cookie是一种存储在客户端的小型文件,用于记录用户的信息,如访问时间、登录状态等。使用Cookie可以更好地为用户提供服务,比如保存用户的登录状态,记录用户的浏览历史记录等。…

    2023-05-07 02:18:11
    0 76 52
  • cv小敢:如何利用CV小敢提升职业技能?

    cv小敢(Computer Vision Tiny-YOLO)是一种轻量级的物体检测算法,它可以在资源受限的设备上运行,如嵌入式设备、智能手机等。它是基于YOLO(You Only Look Once)算法的一个变体,由Joseph Redmon和Ali Farhadi开发,旨在提高深度学习模型的性能,同时减少模型的大小和计算复杂度。…

    2023-02-09 13:08:59
    0 29 81
  • ubuntu如何编译c语言:在Ubuntu上编译C语言程序的步骤

    示例示例Ubuntu编译C语言的步骤如下:安装gcc编译器:…

    2023-09-08 12:39:20
    0 75 62
  • coremail论客邮箱Coremail论客邮箱

    Coremail论客邮箱是一款专业的企业邮箱服务,可以满足企业对安全、可靠性和高效性的要求。它拥有强大的安全性能,可以提供多种安全保护,包括防止邮件被窃取、拦截恶意邮件、防止跨站脚本攻击等。此外,它还支持多种企业级功能,如组织架构管理、收发邮件管理、文件共享管理、联系人管理等,可以帮助企业提高工作效率,提升企业形象。…

    2023-02-25 04:36:55
    0 20 39

发表评论

登录 后才能评论

评论列表(32条)