项目背景
对于很多公司而言,用户流失率是一个非常重要的数据,其中付费用户的流失率又更尤为得重要。因此,根据用户过去的行为,预测出可能的流失用户,在用户离开之前提供如优惠等一系列挽留措施,以此来最大限度减少付费用户的流失情况。
在这篇文章中,我将根据 Udacity 提供的数据,在 IBM Waston Studio 云平台上运用 PySpark 来对一家叫 Sparkify 的音乐公司进行付费用户流失的预测。
Quick notes
这是一篇关于一个 MySQL query optimizer 问题的定位及解决。
公司系统中一个简单的 SQL 查询却花费了近 3 秒的时间,语句大致为:
1 | SELECT slug FROM products |
其中,id
是 PRIMARY KEY,deleted_at
记录删除时间,用于实现 Soft Delete,也加了索引。deleted_at
允许为空,为空代表是正常商品,不为空代表“已删除”的商品,同时记录下删除时间。