作为与算法同学对接的策略产品经理,我们必须对算法同学常用的算法逻辑有所理解,以下我将先容干系的底层算法逻辑,以及它们所适用的任务类型。
1. 逻辑回归(logistics regression,LR)模型演习种别:监督学习算法。适用问题任务:分类。算法特色:繁芜度低,可阐明性强,线上效果好。
函数公式:

y表示模型预估值,取值范围[0,1],x表示输入模型的特色值,可以理解为终极利用的一系列特色对应的详细数值;T表示矩阵的转置,无实际数值意义;w表示模型为每一个特色演习出的对应参数。以CTR预估模型为例,逻辑回归模型输出的预测值代表的业务意义是用户对物料的兴趣度。
其余,虽然线性回归(linear regression)与逻辑回归简称均为LR,但是线性办理回归问题,逻辑办理分类问题,逻辑回归模型包含线性回归模型,便是线性回归模型。
2. K隔壁算法(K-nearest neighbor,KNN)模型演习种别:监督学习算法。适用问题任务:分类、回归。K的取值是关键成分,须要用交叉验证法(测试集+演习集)验证。注:利用KNN算法的思想是每一位策略产品经理都须要理解的。
分类任务:
1.打算待分类点(黑叉)与其他已知种别点的间隔。
2.按间隔正排,占比最好的种别即为待分类点的种别,打算方法有①欧式间隔、②曼哈顿间隔。
回归任务:
整体思路与分类任务同等,预测点的值即是离预测点最近K个点的均匀值。
总结:
KNN算法没有模型演习缓解,而是直接应用,以是KNN算法在演习环节的韶光繁芜度为0,但是在运用环节,随着样本量陡增、繁芜度的增加,在对付效率哀求极高的场景下无法利用KNN算法。
3. 贝叶斯模型(Bayes Model)模型演习种别:监督学习算法。适用问题任务:分类。模型方向:“逆概率”问题,用于邮件分类,景象预测。
函数公式:
4. K聚类算法(K-Means)模型演习种别:无监督学习算法。适用问题任务:聚类。K-Means没有模型演习环节,利用启示式迭代,K值的选择由业务场景确定,如无需求,可试数。
步骤:
将所有样本分成几个簇,即设定K值。模型重新打算新簇质心,再次归类。不断重复、优化。5. 决策树(decision tree)模型演习种别:监督学习算法。适用问题任务:分类、回归。核心思想:根据有区分性的变量查分数据集。基本框架要素:
1.根节点:包含所有原始样本数据,会被进一步分割成多个子凑集。
2.决策节点和叶子节点:叶子节点“不再被分割”,但可以分,决策节点根据特色连续分割。
3.父节点与子节点:被分割成子节点的节点被称为子节点的父节点。
决策树种类: ①分类树 ②回归树
决策树效果评估:选择哪些特色组合构建效果最好呢?
分类树:基尼不纯度评估,不纯度越低,效果越好。回归树:方差指标评估,方差越小模型拟合效果越好。决策树关键参数:
节点拆分包含的最小样本数:过大欠拟合,过小过拟合,须要交叉验证来调参。叶子节点包含的最小样本数:防叶子节点太多,对付正负样本不均的情形可以分小。决策树最大深度:交叉验证办理。总体叶子节点数量掌握。整体分裂中利用最多的特色数:根据建模履历,开根号的特色数为最佳特色数。6. 深度神经网络(deep neutral network)网上有很多资料先容,可以自己找一下。
大略先容,深度学习中的“深度”指的是其hidden layer,在输出层和输入层中,隐蔽层越多深度越大。深度学习与常规神经网络算法的差异紧张表示在演习数据、演习办法、层数方面。
目前在产品策划领域,深度学习可以办理安防领域、零售行业的视觉识别问题,也有如ChatGPT等的自然语音识别、措辞处理等运用,实体企业如智能驾驶中的地位正在提升,其最早被运用与搜光腿的算法模型中。
二、产品设计模型算法的选择
对付同种业务场景可能利用多种算法,然而作为产品经理,我们须要重点考察模型的两大要点:模型预测的准确性和模型的可阐明性。
对付金融风控等受到强监管的场景,我们更倾向于利用具有可阐明性的模型,而对付搜广推等产品体验场景,我们更看重产品的利用效果,以下是各种算法的利用效益分布图:
本文由 @产品研习中 原创发布于大家都是产品经理。未经作者容许,禁止转载
题图来自Unsplash,基于CC0协议
该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。