Skip to main content

Azure Databricks Job/notebook运行卡住三板斧 之二 查看ThreadDump

分类:  Azure Databricks 标签:  #Azure #Databricks #Spark 发布于: 2023-06-15 21:29:22

我们之前已经分享了如何快速的缓解Databricks job/notebook卡住的办法,如果要详细的分析job/notebook卡住的原因,那么还是得再来一板斧:查看long-running或者是stuck task的Threaddump, 如何缓解可以参考之前的文章: 如何通过Spark UI查看long-running task/stuck job的ThreadDump 要查看ThreadDump的步骤如下: 登录到Workspace, 左侧菜单选择Compute, 然后在cluster list里选择运行的cluster:

Read more

Azure Databricks Job/notebook运行卡住三板斧 之一 重启大法好

分类:  Azure Databricks 标签:  #Azure #Databricks 发布于: 2023-06-15 21:22:46

最近遇到不少用户运行的job/notebook卡住的情况,特地将解决该类型问题的三板斧记录下来。 板斧一 如果用户有在集群上安装额外的library, 特别是在Azure China通过官方的源安装Python包,Jar包(通过Maven), 有较大机率遇到类似的问题,是由于国内机房某些时候访问这些境外的源会遇到无法访问或者下载速度缓慢的原因,这个问题非常容易重现,重现步骤如下: 创建一个集群,并启动。 进入workspace -> Compute, 选择已经启动并创建的集群,然后在Library栏中选择Install New 选择Pypi, 输入一个包名,Repository选择一个不能访问的地址,因为我们这里是为了重现问题。 点击install 整个步骤如下图所示:

Read more