Coding and Paper Letter(七十)
資源整理。
1 Coding:
1.JupyterHub的流量模擬器。
2.前端面試手冊。
3.Python學習課程。
4.從ArcGIS/ESRI格式中提取柵格資料。從Readme來看,似乎在尋求GDAL大佬加持共同構建程式。
5.OCP-Hack專案是為參加OCP HackFest的夥伴準備的動手實驗指導,主要是幫助夥伴在Azure上快速瞭解和運用Azure IoT Services, Azure Cognitiver Services, Azure Machine Learning等。本專案會持續更新以方便夥伴學習到最新的Azure內容。
6.PaddlePaddle (PArallel Distributed Deep LEarning) 是一個簡單易用、高效靈活、可擴充套件的深度學習平臺,最初由百度科學家和工程師共同開發,目的是將深度學習技術應用到百度的眾多產品中。
7.“通過逐步堆疊高效培訓BERT”的原始碼。
8.紐約女子機器學習與資料科學scikit learn研討會資源。
9.PySAL與Python資料棧的地理資料科學。
10.R語言包StatsBombR,可以使用您的登入憑據輕鬆地從API流式傳輸StatsBomb資料,也可以從Open Data GitHub儲存庫免費獲取到R中。
11.R語言包mapscanner,用於列印地圖,繪製地圖,掃描它們,然後轉換為空間物件。
12.機器學習的監督學習——以R語言為例課程。
supervised ML case studies course
13.R語言包comat,comat的目標是基於空間資料建立共生矩陣,包括加權共生矩陣(wecoma)和綜合共生矩陣(incoma)。
14.Python專案車牌檢測。
15.R語言包rcppexamples,簡單的Rcpp例子。
16.網路爬蟲學習。
17.一個簡單的LaTeX模板,用於建立事件名稱標籤。
18.在任何Web瀏覽器中執行的開源虛擬星球Web應用程式,支援WebGL HTML5標準。
19.R語言包myspatial,在R中進行空間資料分析和建模的函式集合。來自Roozbeh Valavi。
20.X-DeepLearning(簡稱XDL)是面向高維稀疏資料場景(如廣告/推薦/搜尋等)深度優化的一整套解決方案。
21.關於機器閱讀理解的必讀文章。
22.容器裡的kepler.gl,這是uber公司開源的webgl視覺化神器。
23.機器學習演算法的提升建模和因果推理。
24.一個用於Python的增壓SQLite庫。
25.寫輪眼包的r slides轉ppt樣例。
26.XrViz是一個用於視覺化瀏覽Xarrays的互動式圖形使用者介面(GUI)。 您可以沿各種維度檢視資料陣列,檢查資料值,更改顏色對映,提取系列,在地圖上顯示地理資料等等。 它建立在Xarray,HvPlot和Panel上。 它可以與Intake一起使用,以平滑調查和載入資料集的過程。
27.80種方式遍佈全球——製圖教程:介紹如何使用地理資料和地圖。
28.R語言視覺化,日本火山的山體陰影。
29.一個R語言專案的proposal,全域性地理空間分析。
30.R語言包ggnewscale,ggnewscale嘗試在ggplot2中使用多個顏色和填充比例。
31.示例儀表化電子商務應用程式。
32.全新的小程式開發體驗。
33.hmm是一個高度圖網格劃分實用程式。
34.應用機器學習來預測LendingClub.com上的貸款沖銷。
35.StarQuant(中文名:易數交易系統)是一個輕量的、面向個人( 普通)使用者的綜合量化交易回測系統,目前主要用於期貨期權程式化交易,後期會考慮加入股票交易的功能。
36.在ggplot2中構建繪製高質量質量圖片的分步示例。
37.R語言包VICmodel,VICmodel是可變滲透能力(VIC)巨集觀分散式水文模型的R實現。
38.R語言包modelplotr,modelplotr包可以輕鬆建立大量有價值的評估圖,以評估預測模型的業務價值。 使用這些圖表,可以顯示模型的實施將如何影響業務目標,如響應或廣告系列的投資回報。
39.R語言包ggpointdensity,散點圖和2D密度圖之間的交叉。
40.CWATM是IIASA水計劃的一個新的關鍵要素,用於評估全球和區域層面的供水,水需求和環境需求。
41.R語言包baRcodeR,baRcode生成器標籤,用於生物樣本的更多可重複工作流程。
42.“3D多目標跟蹤基準”的官方Python實現。
43.R語言包wordcountaddin,一個RStudio外掛,用於計算R markdown文件中文字中的單詞和字元。 它還具有計算可讀性統計資訊的功能,因此您可以瞭解文件的讀取容易程度或難度。
44.計算機視覺專用的資料集,變換和模型。
45.R語言包mlr3db,使用資料後端擴充套件mlr3包以透明地處理資料庫。 內部依賴於包dplyr和dbplyr的抽象。
46.有關建立R建模包的建議。
model implementation principles
47.針對某一事件話題下的新聞報道集合,通過使用docrank演算法,對新聞報道進行重要性識別,並通過新聞報道時間挑選出時間線上重要新聞。
48.專門整理github的資源的資源倉庫。
49.數學學習相關資源。
50.Jekyll的乾淨簡約主題。
51.R語言包openeo,包含允許與openEO後端伺服器互動的函式和類。
52.R語言包RSAGA,通過執行SAGA的命令列版本,從R內部訪問地理資訊系統(GIS)'SAGA'(自動地球科學分析系統)的地理計算和地形分析功能。
53.社會科學資料工匠研討會。
54.R語言包slide,slide提供了一系列通用的“滑動視窗”功能。 API有目的地非常類似於purrr,這些函式的目標通常是計算滾動平均值,累積總和,滾動迴歸或其他基於“視窗”的計算。
55.用作編寫和執行MOOSE PorousFlow模擬輸入檔案的python介面。
56.R語言包ceramic,目標是獲得網路地圖瓦片。 使用空間物件定義感興趣的區域。
57.網際網路上的免費書籍。
58.一種高效的深度學習叢集動態資源排程器。
59.R語言包PMwR,實際管理金融投資組合的功能:回溯測試投資和交易策略,計算損益和回報,分析交易,報告等。 PMwR的目標是提供一小組可靠,高效和方便的工具,幫助處理和分析貿易/投資組合資料。
60.分析評估五大湖休閒海灘BMP可能引起的水質變化的資料。
61.Jupyter筆記本中的電子表格外掛。
62.R語言包distill,Distill for R Markdown是一種針對科學和技術交流而優化的網路釋出格式。
63.程式設計師技能圖譜。
64.GDAL的Julia版本。
65.通過AlphaGo Zero方法學習國際象棋強化。
66.用於讀取,寫入和建立Dfs0,Dfs2,Dfs3和Res1D的Python方法。
67.PyTorch中的貝葉斯優化。
68.PySAL與Python資料棧的地理資料科學的書。
69.描述性的機器學習解釋。
70.用於自然語言處理(NLP)的最先進的預訓練模型庫。
71.R語言包golem,是建立生產級shiny應用程式的固定框架。
72.在GitHub上使用的精彩動作的精選列表
73.H2資料庫的空間擴充套件。
74.Flask的Rest API。
75.R語言包pmapply,pmapply的目標是在一系列向量上應用成對函式。
76.Gitalk是一個基於Github Issue和Preact的現代評論元件。
77.全國大學生數學建模競賽 LaTeX 論文模板。
78.katiejolly的部落格。一位資料科學家。
79.本網站包含PPHA 31002隨附的為期5周的統計I編碼研討會的內容。該課程於2019年秋季學期為芝加哥大學哈里斯公共政策學院的學生講授。
80.100天的機器學習課程。
81.R語言包waterquality,目標是將衛星反射影象轉換為一系列預定義的水質演算法,用於檢測cholorophyll-a,藍綠藻(藻藍蛋白)和濁度。 該軟體包能夠處理以下感測器配置:WorldView-2,Sentinel-2,Landsat-8,MODIS,MERIS和OLCI。
82.最愛的R包集合。
83.一種機器學習程式,能夠識別外匯或股票資料中的模式。
Forex and Stock Python Pattern Recognizer
84.與空間相關的程式碼,API,資料和其他資源的精選列表。
85.高階視覺化教程。
86.南加州大學的城市資訊學課程。
87.面向物件的純Python B-Spline和NURBS庫。
88.R語言包TraitMatching,如倉庫名稱的論文的程式碼。
89.遞迴voronoi圖。
90.動手學深度學習一天訓練營。
91.R語言包microsimulation,微觀模擬是一種基於個體的隨機模擬。
92.輕鬆的超引數優化和跨機器學習演算法和庫的自動結果儲存。
93.Depthy顯示具有3D視差效果的Google Camera Lens模糊照片,並從中建立動畫GIF。 加上深度圖提取,讓您建立自己的深度圖!
94.用於實時地形網格生成的JavaScript庫。
2 Paper:
由於缺乏準確的灌溉資訊,灌溉地區土壤水分,土壤溫度和表面湍流通量的最佳估算受到限制。為了解決不精確灌溉量的輸入不確定性,提出了一種改進的資料同化方案,即EnKS(Ensemble Kalman Smoother),通過膨脹和定位(稱為ESIL)來估算灌溉土壤水分,土壤溫度和表面湍流通量。通過同化多源觀測來實現這些領域。位於黑河流域中游灌溉玉米農田的達曼站在本研究中被選中,以研究擬議的同化方案的效能。將第一層土壤中測得的地表溫度(LST)和表層土壤水分(SSM)作為觀測值,進行一系列資料同化試驗,分析缺乏灌溉資訊和多源觀測組合的影響。估算土壤溼度,土壤溫度和表面湍流通量。本研究證明了ESIL在改善未知灌溉條件下水熱條件估算中的可行性。對於第一層土壤水分和土壤溫度,與ESIL方法的係數相關係數(R)分別從0.342和0.703增加到0.877和0.830。同時,表面湍流通量顯著提高。李新老師團隊的成果,發表於農林科學top雜誌農林氣象。多源資料同化路面模型,使用黑河流域的資料。重點是針對土壤水分、土壤溫度以及表面湍流通量的估算改進。這幾個變數是地表建模以及未來氣候變化建模研究的重要引數,尤其對於森林碳迴圈。
夜光遙感觀測為我們提供了及時和空間明確的人類活動測量,因此可以實現諸如跟蹤城市化和社會經濟動態,評估武裝衝突和災害,調查漁業,評估溫室氣體排放和能源使用等一系列應用。夜光遙感新的和改進的感測器,演算法和產品用於分析光汙染和健康影響,與其他對地觀測和輔助資料(例如,地理位置大資料)相結合,共同為深入理解人類活動和相關的環境後果提供了巨大的潛力。改變世界。本文回顧了夜光遙感感測器和產品的進展,並從兩個方面(即人類活動和環境變化)探討了夜光遙感對於感知變化世界的貢獻。在對夜光遙感技術進展的歷史回顧的基礎上,總結了當前夜光遙感研究面臨的挑戰,提出了四個戰略方向,包括:改善夜光資料;開發一系列一致的夜光資料;將夜光觀測與其他資料和知識相結合;並促進對夜光觀測的多學科和跨學科分析。包含餘柏蒗老師、周成虎院士等人在內對夜光遙感衛星觀測當前應用、進展、挑戰和前景的闡述。回溯了當前夜光遙感重要的幾個研究領域,也提出了很多展望。是一篇非常不錯的夜光遙感入門文章。
已經假設城市樹木有效地清潔空氣顆粒物質(PM),而種間差異尚未明確定義,尤其是PM化學成分。在這項研究中,來自3種常綠樹種(杜鬆:杜鬆;黑松:Pinus tabuliformis var.mukdeais;雲杉:紅皮雲杉)的葉表面和蠟層的PM用於發現PM吸附及其組成性狀的差異(表徵通過X射線衍射,X射線光電子能譜,傅立葉變換紅外光譜和電感耦合等離子體發射光譜法)。通過詳細的整個城市樹木普查和物種調整資料的不同情景,還評估了PM去除的可能改進。我們發現:1)杜松葉上PM的含量為5.73 g.m-2,比黑松和雲杉高2-2.5倍(p小於0.05)。其中,蠟層中有38.73%,38.22%和23.11%。 2)與PM數量的明顯種間差異相比,更復雜的種間差異表現出不同成分性狀的不同模式。通常,葉面PM具有較高的O,Si,Al,Fe,N,Pb,Cu,Ni,Cr和Cd,而蠟PM具有較高的C和Na含量(p 小於0.05)。3)關聯排序發現葉片尺寸越小,葉片含水量越低,單位質量葉面積越大,蠟含量越高,氣孔開度越大,葉片PM吸附量越大。 4)與其他2種物種相比,城市森林中杜鬆百分比的增加對於最大限度地從空氣中去除PM更有效,伴隨著更多的重金屬去除,但PM中的結晶礦物質更少。我們的研究結果強調,城市綠化中適當的物種配置可以最大限度地提高空氣PM去除能力。定量試驗的城市樹木滯塵研究,同時還結合了巨集觀的樹木普查資料,可以為巨集觀森林滯塵提供一些參考。
地理建模的關鍵問題之一是準備足夠且適合模型的輸入資料。這需要相當多的時間,精力和專業知識,因為地理模型及其應用環境複雜多樣。此外,資料和資料預處理工具都是多源,異構的,有時對於特定的應用程式上下文不可用。手動準備輸入資料的傳統方法不能有效地支援地理建模,尤其是對於複雜的整合模型和非專家使用者。因此,迫切需要有效的方法,這些方法不僅能夠為模型準備適當的輸入資料,而且還易於使用。在本綜述文章中,我們首先分析影響資料準備的因素,並討論在開發地理模型的輸入資料準備方法時應完成的三個相應的關鍵任務。然後,通過將地理模型的現有輸入資料準備方法分類為三類:手動,(半)自動和智慧(即,不僅(半)自動但也適應應用上下文)方法。在採用知識表示和推理技術的支援下,該領域的最先進方法指向地理模型的智慧輸入資料準備,其中包括知識支援的發現和資料預處理功能的連結,知識 - 資料預處理的驅動(半)自動工作流構建(或地理Web服務環境中的服務組合),以及基於人工智慧規劃的服務組合及其引數設定。最後,我們從以下幾個方面討論挑戰和未來的研究方向:模型資料和工作流的共享和重用,資料發現和處理功能的整合,面向任務的輸入資料準備方法,以及地理建模知識庫的構建,所有這些通過智慧輸入資料準備,幫助開發易於使用的地理建模環境。朱阿興老師團隊的成果,一篇關於地理建模輸入資料準備綜述。事實上這個輸入資料準備很像當前AI研究,從弱、半人工智慧邁向全人工智慧,地理學也正在隨著大資料、人工智慧而不斷髮展。
5.A Spatial Perspective on the Econometrics of Program Evaluation/程式評價計量經濟學的空間透視
區域科學的實證研究對因果推理越來越感興趣,利用計量經濟學,統計學和相關領域的見解。這導致了幾篇概念論文和實證論文。然而,在這種背景下,空間效應(例如空間依賴性(SD)和空間異質性(SH))的作用還不太清楚。這種空間效應違反了Rubin提出的所謂的穩定單位處理值假設,作為經驗處理效果分析的基礎框架的一部分。在本文中,我們更仔細地考慮空間效應的作用。我們簡要概述了一些擴充套件現有計量經濟學處理效果評估方法的嘗試,並考慮了空間方面和概述,並說明了另一種方法。具體而言,我們提出了一個空間明確的反事實框架,利用空間面板計量經濟學來解釋治療選擇,治療變異和治療效果中的SD和SH。我們通過複製眾所周知的治療效果分析來說明這一框架,即1970 - 1984年期間美國各州最低法定飲酒年齡法對死亡率的評估效果,這是應用因果推理的經典教科書範例。我們複製了文獻中的結果,並將這些結果與包含空間效應的一系列替代規範進行了比較。來自區域性莫蘭指數之父Lucas Anselin的一篇論著關於計量經濟學以及空間效應的文章,經濟地理與空間計量經濟的因果推理典型案例解析。
農業景觀樹木在生態系統服務中發揮著至關重要的作用,包括支援人類生計的糧食安全。它們可以進一步提供適應和減緩之間的協同作用,以應對氣候變化影響。瞭解地上樹木生物量和沿海拔梯度的土壤有機碳儲量為更好地管理碳庫提供了機會。然而,關於海拔梯度如何影響農田的木質生物量碳和土壤的分散樹木的土壤,特別是在乾旱地區,人們知之甚少。方法:研究區域分為五類(500-1000,1000-1500,1500-2000,2000-2500和2500-3000m a.s.l)。從每個分層的海拔梯度中隨機選擇樣方(100 m×50 m)。在每個取樣點,在60 cm土壤深度採集一個複合土壤樣品進行土壤有機碳分析。出於木質生物量估計的目的,使用針對類似區域開發的異速生長方程。最後,估算地上生物量碳(AGC),地下生物量碳(BGC),土壤有機碳(SOC)和總碳儲量(TC)狀態,並使用單因素方差分析(ANOVA)比較變數。結果:結果表明AGC,BGC,SOC和TC隨海拔梯度變化顯著(p小於0.05)。高海拔(2500-3000米)AGC,BGC,SOC和TC儲量估計分別為17.97 Mg C ha-1,6.53 Mg C ha-1,23.09 Mg C ha-1,47.59 Mg C ha-1 ,並且顯著高於其他海拔梯度。結論:我們得出結論,農田上的零星樹木具有很高的碳儲存潛力,這可能極大地促進了氣候適應性綠色經濟戰略,並應促進其保護。分析農田景觀樹木的碳儲量潛力,事實上筆者在完成畢業論文的時候經評閱老師提醒發現IPCC2006年溫室氣體清單編制指南就已經將農田作為碳源計算,事實上農田的固碳潛力與其碳排放的關係當前沒有多少研究做的準確,這篇文章雖然僅僅是利用簡單的異速生長模型計算分析,但仍然具備很大的意義。
儘管近年來社會經濟發展與PM2.5濃度之間的關係引起了多學科學者的極大關注,但PM2.5濃度與能量消耗,能源強度,經濟增長和不同收入國家城市化之間的因果關係水平仍然知之甚少。本研究根據收入水平將國家分為四個小組,以調查1998-2014年期間能源消耗,能源強度,經濟增長,城市化和PM2.5濃度之間的偶然關係。為實現這一目標,採用了平衡的面板資料和計量經濟學方法。結果表明,在所有組中,PM2.5濃度與所研究的變數之間存在協整關係。基於向量誤差校正模型的面板格蘭傑因果關係檢驗的結果表明,能源消耗,能源強度,經濟增長和城市化導致長期PM2.5濃度增加。經濟增長是影響全球小組,高收入小組和中高收入小組PM2.5濃度的主要變數。我們認為,除了那些屬於低收入群體的國家外,所有國家的短期內能源強度都可以降低PM2.5濃度。相反,短期內降低城市化水平並不是減少PM2.5濃度的有效方法。我們的研究結果進一步表明,能源消費結構是影響中低收入和低收入國家PM2.5濃度的最大因素。PM2.5影響因子的研究,利用面板資料和計量經濟學方法分析PM2.5與能源消費結構、能源強度、經濟增長與城市化的關係。從結果而言,應該是如預期所料。而關於後續的政策分析還是具有更大的價值,指出不同發展層次的國家的汙染控制政策強度與方向。
成功申辦2022年冬季奧運會(北京2022年,官方稱為第二十四屆冬奧會),極大地激發了中國人對冬季運動參與的熱情。因此,由於巨大的市場需求和政府支援,中國滑雪產業正在迅速蓬勃發展。但是,在不合理的地點投資滑雪場將從經濟角度(在運營和管理方面)以及地理問題(如環境退化)方面造成問題。因此,根據科學指標評估滑雪場的適宜性已成為滑雪產業可持續發展的先決條件。在這項研究中,我們通過基於地理資訊系統(GIS)空間分析結合遙感,線上和實地調查資料的線性加權方法,綜合其自然和社會經濟條件,評估中國滑雪場的位置適宜性。評估自然適宜性的關鍵指標包括積雪,氣溫,地形條件,水資源和植被,而社會經濟適宜性則根據經濟條件,交通的可達性,到旅遊景點的距離以及到城市的距離來評估。因此,考慮到自然和社會經濟條件,從0到1的度量被用於定義滑雪場開發的每個候選區域的適合性閾值。當位置綜合指數小於0.5時,滑雪場被認為是一個令人沮喪的前景。結果顯示,84%的現有滑雪場位於綜合指數大於0.5的區域。最後,基於多標準指標提出了相應的決策者發展戰略,這些指標將擴充套件到納入未來氣候變化和社會經濟發展的潛在影響。但是,應使用具有本地資料的造雪模型來進一步分析特定滑雪場的適用性。比較有意思的研究,關於2022冬奧會的一篇文章,基於GIS手段分析當前滑雪場適宜性分析,結合了大量的遙感、實地調查資料。很接地氣的研究。
以前的研究已經認識到邊緣對犯罪的重要性。各種學者已經探索了一種特定型別的邊緣如物理邊緣或社會邊緣如何影響犯罪,但很少研究複合邊緣效應的重要性。為了解決這一差距,本研究介紹了Suomi國家極地軌道合作衛星(NPP-VIIRS)上的可見紅外成像輻射計套件感測器的夜光資料,以測量複合邊緣。本研究將邊緣定義為夜間漸變 - 夜間光線從畫素到其鄰域的最大變化。利用夜間燈光梯度和道路水平的其他控制變數,本研究應用負二項迴歸模型來研究邊緣對辛辛那提街頭搶劫率和入室盜竊率的影響。模型的Akaike資訊準則(AIC)表明,夜間漸變可以提高街頭搶劫和盜竊模型的適用性。此外,夜間漸變對街頭搶劫率產生積極影響,同時對入室盜竊率產生負面影響,這兩者在α值為0.05時均具有統計學意義。對這兩類犯罪的不同影響可以通過犯罪的性質和原地特徵(包括夜燈)來解釋。來自柳林老師團隊的成果,分析夜間燈光對街頭搶劫與入室盜竊的影響。這個研究相比於以前的犯罪地理研究加入了一個關鍵的因子:夜間燈光梯度。但是過去也有人研究街頭燈光對犯罪的影響,但是從大尺度對地觀測的研究,這還是筆者見到的第一篇研究,非常值得關注這一方