1. 程式人生 > >淘寶穿衣搭配演算法_方案三

淘寶穿衣搭配演算法_方案三

ReplaceItem1.java將原先的matchsets中的產品替換為它的分詞結果,分詞結果以空格隔開,產品與產品間用逗號隔開,輸出結果ToTerms1.txt。為了之後比較每個產品與預測產品的相似度,排除方案二中出現多可替代產品,而造成該搭配的相似度虛高的情況(比只有一種產品,但是它們分詞重合的面比較廣)
CommonCount1.java將預測產品的分詞結果和每行都算相似度(分詞重合的個數除以預測產品的分詞個數)將一行產品的相似度最高值儲存為該行的相似度值,然後根據相似度降序排序.
將大於相似度大於0.8的前100條搭配套餐的行號記錄下來(輸出檔案:line_0.8
將大於相似度大於0.6的前100條搭配套餐的行號記錄下來。(輸出檔案:line_0.6


將大於相似度大於0.6的前100條搭配套餐的行號記錄下來。如果該行最高的相似度達不到0.6,那隻取第一條(輸出檔案:line0.6_100
將大於相似度大於0.6的前10條搭配套餐的行號記錄下來。如果該行最高的相似度達不到0.6,那隻取第一條(輸出檔案:line0.6_10
將line0.6_10中補上line_0.8中出現不止10條的記錄(輸出檔案:line0.6_10_0.8

SelectTop200_1.java根據行號找到相應的搭配套餐,剔除同類產品,將其搭配產品輸出到檔案(final_example.txt),
ReplaceItem2.java將final_example中的每個產品的id替換為其分詞結果(分詞結果用空格隔開,產品用逗號隔開),(輸出結果:ExampleToTerms.txt

)
然後對每行的每個分詞結果去到產品庫中找出最相似的產品,(可以先排序,可以設定閾值>0.8),每行的都要去產品庫匹配,然後所有匹配商品都要放在一行,用逗號隔開
關於推薦個數選取問題:首先對於每個產品都有相似的產品,必須按相似度排序,map:id->commoncount/count-foreitem(也可以用兩個陣列存),如果推薦example為1個,那必須要推薦200條,不管第200條與之相似度到底有多低,如果推薦example為n個,第一個推薦200*(2*i)/(n+n*n) i由n到1,也不管相似度的大小了,根據原先的相似度配比,選擇個數
CommonCount2.java統計各推薦組合中的某個商品與預測商品的相似度(最高相似度)輸出結果:simila.txt

CommonCount3.java統計各推薦組合中第幾個是該組合中與預測商品相似度最高的商品,輸出(simila_place.txt)與simila.txt相對應(之後要將該商品與其可替代商品剔除)1表示b[1],即該行第二個產品
Match_ToTerm.java將match裡的東西都變成分詞結果,分詞空格隔開,產品間可替代還是用逗號,搭配用;隔開,輸出檔案ToTerms2.txt
MatchDeleteLine.txt,輸出檔案ToTerms3.txt,將dim_fashion_matches.txt中第一列刪除。
SelectTop200_2.java輸出檔案final_example1.txt,排除原先因為相似度很像,而cat不同而沒有排除的商品,即找到該搭配組合中一個商品跟被預測商品很像,但是它們的cat不同
SelectTop200_3.java 輸出檔案final_example1.simila.txt,是final_example1.txt對應產品的相似度。
ReplaceItem2.java將final_example1.txt中的每個產品的id替換為其分詞結果(分詞結果用空格隔開,產品用逗號隔開),(輸出結果:ExampleToTerms1.txt)
將final_example1.txt中的產品與dim_items.txt中產品做相似度排序,取(200*0.6/(0.6+0.6)條)final_example1_simila.txt中的是final_example1.txt中對應位置的相似度
ChoseFirst.java(輸出結果ExampleToTerms2.txt)將ExampleToTerms1.txt中的第一個分詞結果提取出來,因為後期看到兩個類似的推薦搭配,產品庫中與它們相似的一些產品可能有很大一部分重複,由於這部分先前寫的排序演算法效果不佳,後期可以在各種搭配的推薦商品都可以嘗試地推薦一部分類似的
ForeResult.java(輸出:Result2.txt)將ExampleToTerms2.txt中到產品庫匹配最相似的200條
RemoveEnd.java(輸出:Result4.txt)將Result2.txt最後的分號摘掉
ToFinal2.java 格式轉換Result4.txt ->final4.txt

相關推薦

穿衣搭配演算法_方案

ReplaceItem1.java將原先的matchsets中的產品替換為它的分詞結果,分詞結果以空格隔開,產品與產品間用逗號隔開,輸出結果ToTerms1.txt。為了之後比較每個產品與預測產品的相似度,排除方案二中出現多可替代產品,而造成該搭配的相似度虛高的

穿衣搭配演算法_賽制描述

關於使用者歷史購買資料:舉個簡單例子可能會存在使用者買了上裝A後又買了與之搭配的下裝B,配飾C等等。 關於terms:淘寶的商品標題大部分為有規律性的,其中可能會包

【天池競賽系列】穿衣搭配演算法第二賽季12名思路

給的資料集有4部分 達人搭配組合 商品資訊 購買記錄 線上測試集 在第一賽季中的思路和阿里星小江分享的差不多 http://datartist.cn/?p=5 第二賽季自己實力不夠,思路陷入迷信模型中,導致被幹出了前10 那麼我就來講講12名的思路吧 首先根據達人搭配

排名演算法(二)--搜尋排序演算法分析

原文:https://blog.csdn.net/u011966339/article/details/78052569  淘寶搜尋排序的目的是幫助使用者快速的找到需要的商品。從技術上來說,就是在使用者輸入關鍵詞匹配到的商品中,把最符合使用者需求的商品排到第一位,其它的依次排在後續相應

ANDROID廣告輪播DEMO_仿廣告輪播_滑動圖片廣告例子

今天在專案中遇到了這樣的需求、輪播圖片來展示商品、剛剛已經分享了一種方法 但是我覺得這種還是達不到我的要求、所以我後臺又換了一種方式、比較好 跟淘寶京東的商品展示非常像、很符合的我胃口、現在分享出來、供大家使用 程式碼簡單、設定簡單、自定

SEO】官方搜尋排序演算法淺析(鬼腳七)

淘寶上有幾百萬的賣家,根據二八原則,20%的賣家佔了80%的交易,可能在淘寶搜尋的比例比這個還要高,15%的賣家,佔了80%的交易。在論壇上,經常有人在說,我們中小賣家生意沒法做了,淘寶不關心我們。其實這個理解完全錯了。大賣家之所有得到更多的流量,就是因為他們更熟悉搜尋的一些規則,做了更多的優化。而中小賣家,

0512日重點:的H5手機端自適應解決方案:Flexible

自動獲取 手機端 issue 解決方案 target 解決 flex get bsp 參考文檔: https://github.com/amfe/lib-flexible https://github.com/amfe/article/issues/17 自我總結:F

Python爬蟲()爬MM圖片

name os.path app dir util mozilla user mac baseurl 直接上代碼: # python2 # -*- coding: utf-8 -*- import urllib2 import re import string impo

網上做刷單員兼職被騙怎麽辦-百度_經驗

兼職 刷單 網上做淘寶刷單員兼職被騙怎麽辦-百度_經驗【支付寶全民小二QQ:951883135】我們將全力為您追回所有被騙去的資金等,支付寶全民小二QQ:【951883135】 微信、支付寶 淘寶、刷單被騙 維權投訴、等等其他的業務。 之前我就是通過這個方法把錢追回。網上做淘寶刷單員兼職被騙怎麽辦-百

手機flexible布局探索及最終方案

https write append post clas var www www. 情況 相關文章 http://blog.csdn.net/junreycen/article/details/51261653 http://www.html-js.com/article/

等seo廣告裏面所講的天上首頁的快排技術大揭秘

itl 技術分享 導航 開始 編碼 第一個 IE 關鍵詞 打擾 淘寶等seo廣告裏面所講的三天上首頁的快排技術大揭秘 淘寶seo快排技術 今天,我在誌在指尖群裏面看了看,有人說做一個排名其實非常的簡單(我去,簡單?想做好seo這是何等漫長的一個事情,談何簡單)我們都知

PYTHON 爬蟲筆記十:利用selenium+PyQuery實現美食數據搜集並保存至MongeDB(實戰項目

pre pager 淘寶 NPU group color 存在 pan rgs 利用selenium+PyQuery實現淘寶美食數據搜集並保存至MongeDB 目標站點分析 流程框架 爬蟲實戰 spider詳情頁 import pymongo im

2018最新面試出爐:分散式鎖+叢集+一致Hash演算法+底層技術原理

是需要掌握牢固,重點會問HashMap等集合類,以及多執行緒、執行緒池等。   原文連結:https://blog.csdn.net/SpringJavaMyBatis/article/details/83415696     &n

彈性佈局方案lib-flexible不相容ipad和ipad pro的解決方法

加上下面這一段程式碼即可 <script> /(iPhone|iPad|iPhone OS|Phone|iPod|iOS)/i.test(navigator.userAgent)&&(head=document.getElementsByTag

實習個月,學習總結

              技術: 1.  自動化測試技術; Automan原理: iTest原理: 2.  學習測試外圍技術: ruby語言:掌握基本預發即可; Maven構建

天賣出153萬雙襪子,新制造驅動萬億級價效比市場大升級

"通過天天特賣的資料,我們更精準的看到了使用者的需求。像這樣的女襪,我們按照消費者意願,降低了筒高和皮筋彈性。消費者得到了更時尚和舒適的襪子,我們也省下了8%的成本。也創下了三天銷售153萬雙的銷售奇蹟。"在日前進行的淘寶天天特賣品牌升級媒體溝通會上,來自浙江的"襪二代",天穿襪業總經理楊鋼澤先生說道。

關於微信跳轉手機方案調研 2

戲言戲語: 做電商難?企業轉型難?做大零售難?做粉絲營銷難?做淘寶京東難?新環境下做品牌難?這個時代,好像幹啥都難! 難的原因,無非就是兩個:一個是環境競爭激烈;第二個是,分工太多了,自己總有不專業的地方。 你說,阿里為什麼要與蘇寧合作?萬達為什麼要聯合幾千家百貨?沃爾

阿里雲互動課堂解決方案助力教育,打造普惠教育平臺

近日,阿里巴巴淘寶教育推出普惠教育平臺,為貴州省印江縣當地中學捐贈線上授課平臺、IOT智慧魔筆等軟硬體裝置。平臺基於阿里雲視訊雲的互動課堂直播技術打造,打破空間的限制,實現了教育的地域連線,將發達地區的名師資源充分下放,惠及偏遠地區教育。 專案背景 據有關平臺

iOS開發之個Button實現圖片無限輪播(參考手機,Swift版)

這兩天使用Reveal工具檢視"手機淘寶"App的UI層次時,發現其圖片輪播使用了三個UIButton的複用來實現的圖片迴圈無縫滾動。於是乎就有了今天這篇部落格,看到“手機淘寶”這個幻燈片的UI層級時,就想要動手使用三個Button來實現一下,當然本篇部落格使用是Swift語言,思路就是使用三個Button進

揭祕286億海量圖片儲存與處理架構,海量小檔案儲存的解決方案

8月27日下午,在IT168系統架構師大會儲存與系統架構分論壇上,淘寶網技術委員會主席,淘寶網核心工程師章文嵩向我們詳細介紹了淘寶網圖片處理與儲存系統的架構。章文嵩博士的演講日程包括了淘寶的整個系統架構、淘寶圖片儲存系統架構,淘寶網獨立開發的TFS叢集檔案系統,前端CDN