ssh && ftp

发布于 2020-08-27 收录于 Linux

ssh sudo apt update sudo apt install openssh-server sudo systemctl status ssh # 查看服务状态 sudo systemctl disable #取消自启动 sudo systemctl enable #自启动 ssh-copy-id #上传ssh密码凭证，不用每次连接都输密码 ftp sudo apt install vsftpd #查看其运行状态

vim配置

发布于 2020-07-28 收录于 Linux

vim配置新建配置文件： vim ~/.vimrc，填入以下配置信息： """"""""""""""""""""""""""""""""""" """=>全局配置<=""

数据预处理

发布于 2020-05-17 收录于机器学习

数据分析 pandas -> df.head() 和 df.describe() pandas_profiling -> ProfileReport() train_file_profiling = pandas_profiling.ProfileReport(train_file, config_file="./config_minimal.yaml") train_file_profiling.to_file("train_file_profiling.html") seaborn sns.boxplot() 查看离群点 matplotlib.pyplot plt.scatter() 查看是否具有线性关系数据处理删除列 df.drop() 转换为数值类型 label：sklearn.prepr

统计学习方法笔记二

发布于 2020-05-08 收录于机器学习

逻辑斯蒂回归与最大熵模型都可用于二分类或多分类，都是对数线性模型支持向量机二分类模型，与感知机不同的是SVM模型选取准则是间隔最大化，而且当

参数估计

发布于 2020-05-05 收录于机器学习

假设数据集服从概率分布$P(\theta)$，估计$\theta$ 极大似然估计假设：参数$\theta$是一个定值目标：找出一个$\thet

统计学习方法笔记一

发布于 2020-05-04 收录于机器学习

概论统计学习方法三要素：模型、策略、算法精确率、召回率、准确率、F1-score 精确率：$P=\frac{TP}{TP+FP}$ 召回率：$R

集成学习

发布于 2020-04-30 收录于机器学习

集成学习方法使用多种学习算法来获得比单独使用任何单独的学习算法更好的预测性能另外集成学习希望的就是每个分类器的差异越大越好，这样每个分类器都

LR & GBDT

发布于 2020-04-27 收录于推荐系统

LR GBDT 梯度提升决策树

排序

发布于 2020-04-27 收录于推荐系统

排序将召回的物品候选集根据物品本身的属性结合用户的属性和上下文等信息给出推荐优先级步骤： PreRank 粗排，初步进行排序筛选，为下一步减少数据规模节省时

基于内容的推荐

发布于 2020-04-26 收录于推荐系统

基于内容的推荐 Content Based 特点：思路简单，可解释性强用户推荐具有独立性，不受其他用户的影响缺点：广度较窄，过多地关注用户喜好的物品要积累一定量的用户

1
4
5
6
7
8
13