Azure Databricks Job/notebook运行卡住三板斧 之三 自动抓取Dump
分类: Azure Databricks ◆ 标签: #Azure #Databricks ◆ 发布于: 2023-06-15 21:34:01

我们之前讨论过了如何快速的缓解Job/Notebook
卡住的问题,也分享给大家了如何通过Spark UI
来查看thread dump
, 我们今天分享给大家我们的第三板斧:通过配置让Cluster
自动抓取ThreadDump
, 关于之前的文章,请参考链接:
配置集群自动抓取ThreadDump
请使用如下的步骤来配置集群当有长时间运行或者卡住的Job/notebook
自动抓取Thread Dump
:
登录到workspace, 选择你的
cluster
:
点击右侧的
edit
按钮:如下图输入配置,并保存,然后重启集群
需要注意的是如果Threshold设置比较小,那么会产生很多日志,单位是毫秒。
至此就配置完成了,当有job/notebook
会卡住时,就会自动抓取ThreadDump
, 然后对ThreadDump
进行分析就可以了,如果不会分析,那么就向技术支持提交支持工单吧。