/home.jpg

ssh && ftp

ssh sudo apt update sudo apt install openssh-server sudo systemctl status ssh # 查看服务状态 sudo systemctl disable #取消自启动 sudo systemctl enable #自启动 ssh-copy-id #上传ssh密码凭证,不用每次连接都输密码 ftp sudo apt install vsftpd #查看其运行状态

vim配置

vim配置 新建配置文件: vim ~/.vimrc,填入以下配置信息: """"""""""""""""""""""""""""""""""" """=>全局配置<=""

数据预处理

数据分析 pandas -> df.head() 和 df.describe() pandas_profiling -> ProfileReport() train_file_profiling = pandas_profiling.ProfileReport(train_file, config_file="./config_minimal.yaml") train_file_profiling.to_file("train_file_profiling.html") seaborn sns.boxplot() 查看离群点 matplotlib.pyplot plt.scatter() 查看是否具有线性关系 数据处理 删除列 df.drop() 转换为数值类型 label:sklearn.prepr

统计学习方法 笔记二

逻辑斯蒂回归与最大熵模型 都可用于二分类或多分类,都是对数线性模型 支持向量机 二分类模型,与感知机不同的是SVM模型选取准则是间隔最大化,而且当

参数估计

假设数据集服从概率分布$P(\theta)$,估计$\theta$ 极大似然估计 假设:参数$\theta$是一个定值 目标:找出一个$\thet

集成学习

集成学习方法使用多种学习算法来获得比单独使用任何单独的学习算法更好的预测性能 另外集成学习希望的就是每个分类器的差异越大越好,这样每个分类器都

排序

排序 将召回的物品候选集根据物品本身的属性结合用户的属性和上下文等信息给出推荐优先级 步骤: PreRank 粗排,初步进行排序筛选,为下一步减少数据规模节省时

基于内容的推荐

基于内容的推荐 Content Based 特点: 思路简单,可解释性强 用户推荐具有独立性,不受其他用户的影响 缺点: 广度较窄,过多地关注用户喜好的物品 要积累一定量的用户