加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
您当前的位置:首页 > 产品服务

搞AI的产品经理该怎么写PRD?谷歌的导师教你

时间:2018-11-05 01:55:52  来源:本站  作者:

  最近,谷歌机器学习X 和TensorFlow X团队的产品领导者Clemens Mewald在Medium上发表了一篇文章,详细介绍在开发涉及到机器学习的产品时,产品经理写PRD怎么处理数据相关的问题。

  机器学习不是必需的。我看到,有的产品经理在PRD中将“使用强化学习来优化对用户的奖励”作为一项需求。这通常是一个危险信号。在大多数情况下,机器学习是满足用户需求的一种方式,而不是需求本身。

  答案很简单,如何收集和使用数据将会对产品产生重大影响,更何况这还是一个与人工智能有关的产品。

  首先,你必须搞清楚你要预测什么,也就是你机器学习模型的输出,以及是否有与输出相关的必要反馈机制。

  但是,这种反馈是否能告诉你,他们是因为通知很烦而关掉它,还是说这个通知是有用的,他们只是“完成”了它呢?

  哪些特征可能有用?可以考虑下通知的性质,是提供信息,还是敦促用户采取行动?或者是通知送达的时间。

  此外,要想成为一名有远见的AI产品经理,不仅需要仔细琢磨一下机器学习模型需要输入和输出什么数据,还要确定这些数据是能够使用的。

  说起来也很简单,机器学习模型只不过是一个数学函数,输入一些带有特征的数据,输出预测结果。然后再进行学习,把预测结果与从训练数据中观察到的模式匹配起来。

  这样说可能有点难以理解,是时候再举个例子了。下面这张图,是湾区正在出售的5套住房的实际情况。

  值得注意的是,你可以选择各种值来当做标签,比如说房子的大小、卧室、浴室和房价等等,甚至是邮编。

  另外有一栋我们不知道价格的房子。给定已知的特征,我们可以使用我们训练的机器学习模型来预测这个值。

  在开头那个关于通知的例子中,标签是用户在拒绝通知时提供的反馈。如果他们表示通知是有用的,那就是肯定的标签。

  在我之前的博客文章中,我介绍了一个来自Google Forms的例子,它主要是基于问题的提示,自动为问题选择类型。

  之前,用户会提供问题提示,然后手动选择合适的问题类型。问题提示就是特征,手动选择的问题类型就是标签。

  通常情况下,你可以使用其他数据源的特征来丰富这些数据。不管可行性或成本如何,可以先进行头脑风暴,列出可能对自己的机器学习任务有帮助的潜在特征。

  假设你试图预测房价,但你只有大小、卧室、浴室和邮政编码等特征。你能想出其他的特征吗?条件是,对这个任务有帮助,而且你也能拿得到。

  一旦你能够找到其他的特征,你可以按可用性、有无困难和成本来排定优先级。与此对应的问题是:这些数据存在吗?有授权吗?收集这些数据的成本有多高?

  “需要多少数据”,这个问题的答案可以写成一本教科书。但与开发团队进行对接的时候,产品经理需要把握一些重点:

  2、如果数据很少或没有数据可用,迁移学习可能会有所帮助,从一项任务中获取数据或者模型,并将它们应用到其他的任务中,比如将一个给狗分类的模型用到给汽车分类上。

  3、在获取标记数据需要花费金钱和时间的情况下,需要在模型的质量和性能方面定一个目标,并对花费的钱和时间有清晰的预算。

  这部分表述可能不太清晰。为了让大家更好地理解,可以看看下面这张图。直观地展示了获取更多数据可能有用也可能没用的情况。

  然而,在一些情况下,大量标注的训练数据已经存在,回报可能会减少。也就是说,更多的数据并不能提高模型质量。

  这可能本身没有问题,比如说在Google Forms的例子中,用户对一些问题归到一个类型中有不同的看法。

  在其他的一些情况下,可能是因为不同格式的特征值或语义。比如说一些房价以千美元计,另一些以百万美元计。

  就算你可以访问这些数据,并且可以通过抽查来发现有问题的案例。但在写PRD的时候,你对此也无能为力。

  此外,如果你对数据的质量有所担心,你应该在PRD中提出警告,表示这可能会降低机器学习模型的质量。

  如何存储和处理这些数据也非常重要。在开始收集数据之前,最好咨询隐私和安全方面的专家,弄清楚你能做什么和不能做什么。

  此外,还要花时间考虑一下,你的用户从中获得了什么好处,确定这需要用到的数据。当然,也要让用户认可这些好处,不能只是你自己的想法。

  下面是一些具体问题清单。不管你是在构思一个新产品,还是向既有的产品中添加新的功能,都可以作为参考:

来顶一下
返回首页
返回首页
推荐资讯
相关文章
    无相关信息
栏目更新
栏目热门