/home.jpg

item2vec

原理 item2item(itemCF):基于用户喜爱的item来寻找相似的item推荐给用户 user2item(UserCF,LFM,personal rank):基于用户(喜好、历史行为等)计算出

word2vec

词袋模型 对一个句子的向量,其构造方法为:构造一个长度为语料库中所有不同单词个数的向量,每一维度为句子中单词的出现次数 缺点: 维度灾难 无法保留词

线性回归 & 逻辑回归

线性回归(LR) 概念 一元线性回归、多元线性回归:元代表数据特征的个数,线性代表变量x的次数为1次 优点:实现简单 缺点:不能拟合非线性数据 空间上

python库

numpy 数据类型转换 astype arr = np.array([1,2,3]) arr.dtype #数据类型查看 float_arr = arr.astype(np.float32) float_arr.dtype pandas read_csv pd.read_csv(path, header=, name=) header=0 表示以第一行为标题,若原文件没有标题,则应传入name列表 数据索引 行:data.l

iptables实现服务器中转(ubuntu)

实现中转 开启防火墙IPv4转发 echo -e "net.ipv4.ip_forward=1" >> /etc/sysctl.conf sysctl -p 单端口转发 iptables -t nat -A PREROUTING -p tcp --dport [本地端口] -j DNAT --to-destination [目标IP:目标端口] iptables -t nat -A PREROUTING -p udp --dport [本地端口] -j

数据结构与算法

数组、链表、跳表 数组:查找快,插入慢 vector<int> a; //声明一个int型向量a vector<int> a(10); //声明一个初始大小为10的向量 vector<int> a(10, 1); //声明一个初始大小为10且初始