• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

Spark ALS.train()迭代次数过多导致java.lang.StackOverflowError

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

问题描述:

使用Spark ALS.train()做协同过滤的模型训练时,迭代次数过多(iteration>=30)可能导致java.lang.StackOverflowError的错误。

解决方案:

一般情况下ALS收敛是非常快的,将iteration设置为<30的数字就可以了,绝大多数情况下,设置为15就行。次数过多的情况下就会出现:java.lang.StackOverflowError。当然,也可也通过设置checkpoint来解决。

附问题的原始回答:

Xiangrui Meng added a comment – 07/Oct/14 01:46

This is a known issue. We can fix it by checkpointing intermediate RDDs. For now, please use a smaller number of iterations (<30). Usually, ALS converges within that number of iterations.

 

原始问题报告详见:

https://issues.apache.org/jira/browse/SPARK-3370


鲜花

握手

雷人

路过

鸡蛋
专题导读
上一篇:
最新Spark编程指南Python版[Spark 1.3.0][译]发布时间:2022-05-14
下一篇:
线性代数的本质[转]发布时间:2022-05-14
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap