厦门大学数据库实验室教程
有几个坑

SparkSQL context 在执行sql语句时,现在使用spark.sql()替换sqlContext.sal()

sparkapp使用sbt打包
simple.sbt
直接使用教程中的sbt依赖版本即可,即此处无所谓,不过最好是和本机配置版本一致
sbt package
打包运行时一定要注意联网!!
注意执行此打包命令的位置,要在sparkapp目录下!!
即在有simple.sbt的目录位置执行sbt package命令

spark.sql
执行时目前需要开启hadoop,原理未知,不开会报错

sbt
第一次安装时,直接官网下,现在教程中说的bug已经没有了,会卡住无输出,是正常的,时间非常慢!
第一次打包时,下载的依赖非常多,不断输出,但非常慢!

完成次教程全部都在①台机器上
还未进行集群配置