0%

项目背景

对于很多公司而言,用户流失率是一个非常重要的数据,其中付费用户的流失率又更尤为得重要。因此,根据用户过去的行为,预测出可能的流失用户,在用户离开之前提供如优惠等一系列挽留措施,以此来最大限度减少付费用户的流失情况。

在这篇文章中,我将根据 Udacity 提供的数据,在 IBM Waston Studio 云平台上运用 PySpark 来对一家叫 Sparkify 的音乐公司进行付费用户流失的预测。

Read more »

这是一篇关于一个 MySQL query optimizer 问题的定位及解决。

公司系统中一个简单的 SQL 查询却花费了近 3 秒的时间,语句大致为:

1
2
3
SELECT slug FROM products
WHERE id IN (id1, id2, ...)
AND deleted_at IS NULL;

其中,id 是 PRIMARY KEY,deleted_at 记录删除时间,用于实现 Soft Delete,也加了索引。deleted_at 允许为空,为空代表是正常商品,不为空代表“已删除”的商品,同时记录下删除时间。

Read more »