獲取一篇新聞的全部信息

阿新 • • 發佈：2019-04-01

ret time class .get utf date amp arch arc

新聞的鏈接：http://news.gzcc.cn/html/2019/xiaoyuanxinwen_0331/11110.html

import requests
import re
from bs4 import BeautifulSoup
def getTime(showinfo):
    newsDT=showinfo[0].split(‘:‘)[1]+showinfo[1]+""
    return datetime.strptime(newsDT,‘%Y-%m-%d %H:%M:%S‘)
def click(url):
    id=re.findall(‘(\d{1,5})‘ 
,url)[-1]
    clickUrl=‘http://oa.gzcc.cn/api.php?op=count&id={}&modelid=80‘.format(id)
    res=requests.get(clickUrl)
    newsClick=res.text.split(‘.html‘)[-1].lstrip("(‘").rstrip("‘);")
    newsDJ=‘點擊次數：‘+newsClick+‘次‘
    return newsDJ
def showInfo(info,soup):
    news_title=soup.select(‘ 
.show-title‘)[0].text;
    news_time=info[0].split(‘:‘)[1]+info[1]+""
    news_shenhen=info[3].split(‘\xa0‘)[4].split(‘：‘)[1]
    news_orign=info[3].split(‘\xa0‘)[6].split(‘：‘)[1]
    news_anthuor=info[3].split(‘\xa0‘)[2].split(‘：‘)[1]
    return ‘標題:‘+news_title+‘\n‘+‘作者:‘+news_anthuor+‘\n發布單位:‘+news_orign+‘ 
\n審核:‘+news_shenhen
news_url=‘http://news.gzcc.cn/html/2019/xiaoyuanxinwen_0331/11110.html‘
res=requests.get(news_url)
res.encoding=‘utf-8‘
soup=BeautifulSoup(res.text,‘html.parser‘)
list=soup.select(‘.show-info‘)[0].text.split(‘ ‘);
print(list[3].split(‘\xa0‘))
# print( list[3][ re.search(‘作者：‘,list[3]).span()[1] ] )
print(click(news_url))
print(showInfo(list,soup))

技術分享圖片

獲取一篇新聞的全部信息

ret time class .get utf date amp arch arc 新聞的鏈接：http://news.gzcc.cn/html/2019/xiaoyuanxinwen_0331/11110.html import requests import r

Java鏈接HBASE數據庫，創建一個表，刪除一張表，修改表，輸出插入，修改，數據刪除，數據獲取，顯示表信息，過濾查詢，分頁查詢，地理hash

can charat nfa true 目錄結構 dfa byte sin extra 準備工作 1、創建Java的Maven項目創建好的目錄結構如下：另外註意junit的版本，最好不要太高，最開始筆者使用的junit4.12的，發現運行的時候會報錯。最後把Junit

c#獲取電腦硬件信息參數說明(聲卡篇 Win32_SoundDevice )

ror 能力分配 port ava 清除當前定義 lld Availability --設備的狀態 Caption --對象的簡短描述 ConfigManagerErrorCode --Win32的配置管理器錯誤代碼。 ConfigManagerUserCo

微信獲取用戶基本信息，頭像是一張“暫時無法查看”的圖？

有效 style 判斷圖片查看而且。。獲取用戶基本信息原因 url 是這個 http://wx.qlogo.cn/mmopen/UAqwJ95HSLycmQktIqAYuexoytJ3kJzknQ4icJkNpfUvxfqoNRDY2esKQj3YvxXuQacs

CodeIgniter 入門教程第一篇：信息發布

per 所有控制知識點 image doc ref har 提交一、MVC CodeIgniter 采用MVC架構即：控制層、模型層和視圖層。對應Application下面的文件夾（圖1）：所有新建文件以.php結尾視圖層

爬蟲獲取mobike共享單車信息

gzip 找不到 mac os x msg clu strftime number rms break 背景：端午節假期的時候參加了學校的數學建模比賽，題目是關於共享單車的供需匹配問題，需要獲得共享單車的數量和時空分布情況。在苦苦找尋數據無果的情況下決定自己用爬蟲對天

PHP獲取服務器環境信息

虛擬主機 6.2 執行主機名 true 字符 fastcgi port 服務器環境 PHP獲取服務器環境信息 PHP的php_uname() 函數和$_SERVER(服務器和執行環境信息) echo ‘服務器版本和虛擬主機名的字符串‘.$_SERVER[‘SERVER

在Linux與Windows上獲取當前堆棧信息

flow ces mod exe mode return 開發執行 too 在編寫穩定可靠的軟件服務時經常用到輸出堆棧信息，以便用戶/開發者獲取準確的運行信息。常用在日誌輸出，錯誤報告，異常檢測。在Linux有比較簡便的函數獲取堆棧信息: #include <s

獲取電腦屏幕信息

scrolltop height 邊線 round pre nload cnblogs 電腦網頁 <html> <script> function a(){ document.write( "屏幕分辨率為："+screen.width+"*"+s

通過class類獲取類的方法信息

class類 -1 類的方法 .cn ges img 技術分享測試 images 測試：通過class類獲取類的方法信息

下拉框獲取關聯表的信息

tro () base 返回自己的 option func tip ron 用jq和ajax實現 1.在jsp頁面上 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%><

ArcGIS JS之查詢一個圖層的全部信息

clas link result arcgis ini var tex value add <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> &

aNDROID獲取內存基本信息

lis androi .com baidu android 信息基本 oid 5% aNDROID%E5%B8%83%E5%B1%80%E5%B1%9E%E6%80%A7%E5%85%A8%E9%9D%A2%E5%89%96%E6%9E%90 http://music.

獲取wiki某網頁信息shell即獲取wiki子目錄信息-shell

wiki getopts#!/bin/bash####################################################################################################set -e##需要參數if [ $# -eq 0 ];then

20170820_python實時獲取某網站留言信息

brush 輸入 mozilla ssi 獲取 eight bdr num html 主要用的是request和bs4,遇到最大的問題是目標站是gb2312編碼,python3的編碼雖然比2的處理要好得多但還是好麻煩，最開始寫的是用cookie模擬登陸,但是這個在

用PHP獲取網頁上的信息相對於xpath效率低點

所有 pat ini 自己 str rpo fwrite echo bst 用php實現對網頁的抓取，及信息的收集，其實就是爬數據，具體實現步驟如下，首先應引入兩個文件curl_html_get.php和save_file.php文件，兩個文件具體代碼是這樣

獲取Django-request請求信息

方式 post方式 col cookie pri 數據 ems -s shortcut from django.shortcuts import render, HttpResponsedef index(req): #

獲取響應狀態Status信息、獲取狀態碼Status Code

數據 bootstra 9.png nts web not found sys 獲取 closeable 一般服務器的響應狀態有以下幾種： 200 正常 400 未找到頁面 403 拒絕 500 服務器錯誤比如我們請求bootstrap中文網，此時的狀態碼是200

創建及獲取客戶的會話信息

ont odi sql tle odin lang util int lan session對象其主要作用是存儲、獲取用戶會話信息。 long getCreationTime()用於返回session對象創建時間，單位為ms long getLastAccessedTime

獲取當前方法信息+獲取電腦硬件信息

ram 目錄 rac 獲取 microsoft ear emp names dbase 1 /// <summary> 2 /// 獲取當前方法信息 3 /// </summary> 4

獲取一篇新聞的全部信息

相關推薦