phome_enewsinfoclass数据表字段解释
帝国cms采集规则主表
| 字段名 | 类型 | 解释 | 附加说明 |
|---|---|---|---|
| classid | int(11) | 节点ID | |
| bclassid | int(11) | 父节点ID | |
| classname | varchar(100) | 节点名称 | |
| infourl | mediumtext | 采集页面地址 | 多个地址用回车隔开 |
| newsclassid | smallint(6) | 入库栏目ID | |
| startday | date | 开始时间 | |
| endday | date | 结束时间 | |
| bz | text | 备注 | |
| num | smallint(6) | 采集记录数 | |
| copyimg | tinyint(1) | 远程保存图片到本地 | 1为开启,0为关闭 |
| renum | smallint(6) | 每组信息采集个数 | |
| keyboard | text | 包含采集关键字限制 | |
| oldword | text | 内容替换原字符 | |
| newword | text | 内容替换新字符 | |
| titlelen | smallint(6) | 不采集标题相似超过字数 | |
| retitlewriter | tinyint(1) | 不采集标题相同的信息 | 1为限制,0为不限制 |
| smalltextlen | smallint(6) | 截取内容简介字数 | |
| zz_smallurl | text | 信息链接区域正则 | |
| zz_newsurl | text | 信息页链接正则 | |
| httpurl | varchar(255) | 内容页地址前缀 | |
| repad | text | 过滤广告正则 | |
| imgurl | varchar(255) | 图片/FLASH地址前缀 | |
| relistnum | smallint(6) | 每组列表采集个数 | |
| zz_titlepicl | text | 列表页标题图片正则 | |
| z_titlepicl | varchar(255) | 列表页标题图片预定义值 | |
| qz_titlepicl | varchar(255) | 列表页标题图片地址前缀 | |
| save_titlepicl | varchar(10) | 列表页标题图片远程保存 | |
| keynum | tinyint(4) | 关键字截取标题字数 | |
| insertnum | smallint(6) | 每组入库数 | |
| copyflash | tinyint(1) | 远程保存FLASH到本地 | 1为开启,0为关闭 |
| tid | smallint(6) | 数据表ID | |
| tbname | varchar(60) | 数据表名 | |
| pagetype | tinyint(1) | 分页形式 | 0为上下页导航式,1为全部列出式 |
| smallpagezz | text | 分页区域正则(上下页式) | |
| pagezz | text | 分页链接正则(上下页式) | |
| smallpageallzz | text | 分页区域正则(全部列出) | |
| pageallzz | text | 分页链接正则(全部列出) | |
| mark | tinyint(1) | 图片加水印 | 1为开启,0为关闭 |
| enpagecode | tinyint(1) | 页面编码转换 | 0为不转码 |
| recjtheurl | tinyint(1) | 是否重复采集同一链接 | 1为重复采集,0为不重复采集 |
| hiddenload | tinyint(1) | 是否隐藏已导入的信息 | 0为不显示,1为显示 |
| justloadin | tinyint(1) | 采集后是否自动入库 | 1为开启,0为关闭 |
| justloadcheck | tinyint(1) | 自动入库是否直接审核 | 1为审核通过,0为需审核 |
| delloadinfo | tinyint(1) | 入库后是否删除已导入的记录 | 1为开启,0为关闭 |
| pagerepad | mediumtext | 整体页面过滤正则 | |
| newsztid | text | 入库专题ID | 多个专题ID用“|”隔开,例如:|1|5 |
| |getfirstpic | tinyint(4) | 提取第几张图片为标题图片 | |
| oldpagerep | text | 整体页面替换原字符 | |
| newpagerep | text | 整体页面替换新字符 | |
| keeptime | smallint(6) | 每组采集时间间隔 | |
| lasttime | int(11) | 最后采集时间 | unix时间戳 |
| newstextisnull | tinyint(1) | 内容为空不采集 | 1为开启,0为关闭 |
| getfirstspic | tinyint(1) | 提取标题图片生成缩略图 | 1为开启,0为关闭 |
| getfirstspicw | smallint(6) | 提取标题图片生成缩略图宽度 | |
| getfirstspich | smallint(6) | 提取标题图片生成缩略图高度 | |
| doaddtextpage | tinyint(1) | 入库是否保留原分页 | 0为保留分页,1为不保留分页 |
| infourlispage | tinyint(1) | 采集页面为直接内容页 | 1为是,0为否 |
发表评论