此文档主要收集搜广推算法系列串讲文章 && 搜广推算法知识经典问答(不保证最新)
本文仅做资源收集,未引用具体内容,如有侵权,请联系删除。
由于内容过多,点击README.md左侧按钮可以查看详细目录
- 电商搜索系列
- 旺知识业界趋势
- 策略算法工程师之路
- 从0搭建推荐系统
- 推荐基础
- 如何在工业界优化点击率预估
- 推荐系统从零单排系列
- 广告预估
- 推荐系统架构与工程
- 推荐系统论文笔记
- 电商搜索如何让你买的又快又好
- 推荐算法工程师成长路径
- 推荐系统的发展
- 经典推荐算法学习
- 搜索推荐系统实战
- 推荐系统CTR预估学习路径
- 绝密伏击总结
- 推荐系统论文精读
- 深入理解推荐系统
- 推荐系统的各种类型
- 推荐系统与深度学习论文笔记
- 推荐系统技术演进趋势
- 搜索排序系列
- 搜广推相关问答-算法工程师成长类问答
- 搜广推相关问答-搜广推经验类问答
旺知识: 2022年推荐系统云服务对比调研与展望-阿里,字节,华为,腾讯,Amazon,Azure
旺访谈:搜索科研新人宝典-窦志成教授-人大高瓴人工智能学院副院长
旺知识:2022业界广告推荐技术最新进展与趋势-阿里、腾讯、字节、微软
如何在工业界优化点击率预估:(八)Debias&Loss&校准
推荐系统从零单排系列(一)--DNN for YouTube Recommendations
推荐系统从零单排系列(二)--Item-Based协同过滤算法
推荐系统从零单排系列(三)--再谈亚马逊Item-based推荐系统
推荐系统从零单排系列(四)—Word2Vec理论与实践(上)
推荐系统从零单排系列(五)—Word2Vec理论与实践(下)
推荐系统从零单排系列(六)—Word2Vec优化策略层次Softmax与负采样
推荐系统从零单排系列(七)--Airbnb实时个性化推荐之Embedding真的好用吗?
推荐系统(十三)阿里重排序算法:Personalized Re-ranking for Recommendation
经典推荐算法学习(一) | 从协同过滤CF到逻辑回归LR与因子分解机FM | 附FM python实现
经典推荐算法学习(二)| FFM模型的原理与Python实现
经典推荐算法学习(四)| 阿里LS-PLM(MLR)模型原理解析
经典推荐算法学习(五)| 前深度学习时代 推荐模型演化路径梳理
经典推荐算法学习(六)| Embedding技术理解及在推荐场景的应用举例(附Item2Vec PySpark实现)
经典推荐算法学习(七)| Graph Embedding技术学习 | 从DeepWalk到Node2vec、EGES | 附DeepWalk PySpark实现
经典推荐算法学习(八)| 主流深度推荐模型演化(上)|从Deep Crossing到Wide&Deep、DeepFM | 附模型TensorFlow代码实现
经典推荐算法学习(九)| 主流深度推荐模型演化(下)| 从DIN、DIEN到 MIMN、SIM | 附DIN、DIEN TensorFlow代码实现
经典推荐算法学习(十)| Youtube DNN serving目标解析 | 从odds到Logit 、Logistic Regression
经典推荐算法学习(十二)| 鱼和熊掌何以兼得?漫谈多目标学习在推荐系统中的妙用
推荐系统CTR预估学习路线:从LR到FM/FFM探索二阶特征的高效实现
【总结】推荐系统——精排篇【3】DIN/DIEN/BST/DSIN/MIMN/SIM/CAN
【总结】推荐系统——精排篇【2】WDL/DCN/DCN-v2
【总结】推荐系统——精排篇【1】FM/FFM/GBDT+LR/MLR
[论文精读]01—KDD2018Best Paper : Real-time Personalization using Embeddings for Search Ranking at Airbnb
[论文精读]02—KDD2020:Embedding-based Retrieval in Facebook Search
[论文精读]05—DIN (Deep Interest Network) :当Attention 遇到推荐系统
[论文精读]06—DIEN (Deep Interest Evolution Network) :GRU与DIN的强强组合
[论文精读]07—BST:Transformer在推荐领域的应用
[论文精读]09—BERT4Rec:NLP王者Bert在推荐领域的应用
[论文精读]10—PinnerSage:User Embedding的生成奥义
[论文精读]12—Airbnb搜索排序:从模型驱动到数据驱动的转变
[论文精读]13—召回模型(一) MIND网络:Capsules网络启发下的用户多兴趣向量表达
[论文精读]14—召回模型(二) SDM网络:长短期兴趣的提取与融合
[论文精读]15—召回模型(三) RALM:Attention机制下的实时Look-alike算法在微信看一看中的应用
[论文精读]16—CVR预估(上):多任务全样本空间下的极简ESMM模型
[论文精读]17—CVR预估(下):ESSM的ProMax版——点击后行为分解ESM²模型
[论文精读]18—PLE模型:RecSys2020 Best Paper 腾讯视频多任务个性化推荐
[论文精读]19—美团AITM:金融场景下的顺序依赖性多任务问题解决框架
[论文精读]20—百度MOBIUS:搜索广告系统下的召回层优化
《推荐系统》系列之二:学习预热冷启动物品ID embedding的方法用于冷启动推荐
推荐系统与深度学习(1): [第四范式 2020]NON:听说你们模型结构效果好,那就选择几个组合吧
推荐系统与深度学习(2):[阿里][CIKM 2020] 跨域混合兴趣模型MiNet
推荐系统与深度学习(3):[WWW'18]认识一下带权重的FFM模型——FwFM
推荐系统与深度学习(4):[SINA 2019] SENet从CV到CTR=>FAT-DeepFFM
推荐系统与深度学习(5):能不能统一下CTR论文的评估标准呢?
推荐系统与深度学习(6):[华为 2019]FGCNN: 基于卷积神经网络的CTR特征生成方法
推荐系统与深度学习(7): [Yahoo] FMFM模型: FM|FwFM|FvFM的统一框架
推荐系统与深度学习(8): [Adobe] FEFM和DeepFEFM模型
推荐系统与深度学习(9): [IJCAI'19] IFM: 输入感知的FM模型
推荐系统与深度学习(10): [IJCAI'20] DIFM: 双重IFM模型
推荐系统与深度学习(11): 用于CTR预测的门控增强深度网络
推荐系统与深度学习(12): [京东 CIKM'20 short] CTR预估中的维度关联建模
推荐系统与深度学习(13): [华为 CIKM'21] EDCN: 基于信息共享的并行深度CTR模型
推荐系统与深度学习(14)[腾讯 SIGIR'20] TFNet: 多语义空间特征交互模型
推荐系统与深度学习(15)[阿里 WSDM'21] MIAN: 引入细粒度特征学习的多交互注意力网络
推荐系统与深度学习(16)[iQIYI CIKM'21 short] FINT: 域感知交互(Field-aware Interaction)网络
推荐系统与深度学习(17)[CIKM'21]DCAP: 深度交叉注意力乘积网络
推荐系统与深度学习(18)[CIKM'20 华为] 通过知识蒸馏来提升CTR模型的效果
推荐系统与深度学习(19)[SIGIR'21 清华] AutoPI:自动发现特征交互的通用方法
推荐系统与深度学习(20)[ICDE'22 北大] CL4SRec:基于对比学习的序列推荐
推荐系统与深度学习(21)[SIGIR'22 复旦]FRNet: 上下文感知的特征强化模块
推荐系统与深度学习(22)将网络结构搜索应用于点击率预测(CTR)模型的研究汇总分析
腾讯云智能钛机器学习平台:【技术分享】二:搜索排序—工业流程
腾讯云智能钛机器学习平台:【技术分享】三:搜索排序—机器学习化建模
腾讯云智能钛机器学习平台:【技术分享】四:搜索排序—数据的采集与构造
腾讯云智能钛机器学习平台:【技术分享】五:搜索排序-特征分析
腾讯云智能钛机器学习平台:【技术分享】六:搜索排序—指标介绍与选择
腾讯云智能钛机器学习平台:【技术分享】七:搜索排序—排序模型
为什么有些算法工程师从来不谈业务,不谈解决问题,不谈价值挖掘,开口闭口就是算法模型,炼丹调参工程化?
在大厂裁员浪潮下,算法工程师是否会因为没做出什么成果而更容易被裁?
算法工程师,一个业务做了一段时间之后,指标很难再有比较大的提升,这个时候要怎么办?
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
pairwise 的排序算法用于推荐系统的排序任务中为什么效果差于pointwise的ctr?
pairwise 的排序算法用于推荐系统的排序任务中为什么效果差于pointwise的ctr?
在电商搜索推荐排序中,将ctr和cvr分开建模,相比直接建模ctcvr的优势是什么?
在电商搜索推荐排序中,将ctr和cvr分开建模,相比直接建模ctcvr的优势是什么?
推荐系统,离线 AUC 涨了,线上 CTR 等效果没涨,可能有哪些原因?
推荐系统,离线 AUC 涨了,线上 CTR 等效果没涨,可能有哪些原因?
为什么在验证集和测试集上AUC都比较高,而实际预测效果AUC偏低?
auc说是用来判断排序模型好不好的指标,请问具体数值怎么看呢?越大越好吗?
CTR任务,问下把item_id进行embedding作为特征为什么会有效呢?
CTR任务,问下把item_id进行embedding作为特征为什么会有效呢?
推荐系统算法FM、FFM使用时,连续性特征,是直接作为输入,还是经过离散化后one-hot处理呢?
categorical 特征embedding 之后,和浮点数特征(scalar量)能一起直接拼接吗?
xgb还需要做特征工程吗,可以完全忽略共线性、缺失值的树模型,特征是否越多越好呢?
使用DNN训练神经网络模型时,如何知道每个特征的重要性(像xgboost模型能计算出特征重要性一样)?
推荐系统中的召回模块决定着推荐效果的上限,那么怎么评价召回模块做好了呢?
在推荐系统中,多路召回所谓的并发式,哪路recall数据先到,哪路就先进,这样是否科学?
为什么推荐系统召回阶段常建模为多分类,而排序阶段多建模为二分类?
为什么推荐系统召回阶段常建模为多分类,而排序阶段多建模为二分类?
推荐系统召回中 dssm 和 fm 各自的主要优劣势是什么?
推荐系统召回中 dssm 和 fm 各自的主要优劣势是什么?
为什么现在推荐系统喜欢用双塔模型?双塔模型相较于单塔有什么优缺点?
现在有哪些优秀的图像检索的近似最近邻方法?互联网公司落地使用的ANN算法有哪些?相关会议有哪些推荐?
机器学习中的负采样(negative sampling)方法在什么情况下有效,背后的原因是什么?
推荐精排中如何建模position bias?如何利用一些强bias特征,如”商品点击率“?
position-bias问题为什么将bias特征独立出来比较好呢?
推荐系统中,怎么找出那些没学好的User/Item Embedding?
推荐系统中,如何训练用户和推荐项的词向量,并且保证用户和推荐项是可以求距离的?
factorization machine和logistic regression的区别?
推荐系统中,精排模型之前加粗排小模型在哪些情况有必要,对整个系统来说它的优缺点有哪些?
为什么在实际的kaggle比赛中,GBDT和Random Forest效果非常好?
推荐系统中,精排模型之前加粗排小模型在哪些情况有必要,对整个系统来说它的优缺点有哪些?
请问有没有什么指标,或者从什么维度去评价一个推荐系统下(多个候选)所依赖的优质的视频物料库?
推荐系统的AB实验中,为什么会有“小流量占优”的说法?原理是什么?
在推荐系统中,用户的长短期兴趣:长期兴趣是多“长”;短期兴趣是多“短”,如何衡量其长短?
除了LR,FM(FFM)方法,CTR预测还有那些方法,应用较为广泛?
有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?
ctr预估算法对于序列特征embedding可否做拼接,输入MLP?与pooling相比,优劣在哪?
深度ctr预估中id到embedding目前工业界主流是端到端直接学习还是预训练?
深度ctr预估中id到embedding目前工业界主流是端到端直接学习还是预训练?
都说数据是上限,推荐系统ctr模型中,构造正负样本有哪些实用的trick?