案例5-挖掘微博廣告高權重詞條

阿新 • • 發佈：2018-12-11

微博內容（如圖）：ID content

公式：

TF:詞條在某個微博中出現的詞頻(出現次數).

N：微博總數

DF：詞條在多少個微博中出現過

案例用到四個reduceTask,下標計數從0開始，三個統計詞頻TF，一個統計微博總數N。

FirstMapper.java

對輸入檔案的每行記錄微博內容進行分詞，統計微博詞頻TF及微博總數，每個詞條輸出詞頻數1;每個微博輸出一個count=1

package com.jeff.mr.tf;

import java.io.IOException;
import java.io.StringReader;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;

/**
 *  TF:詞條在某個微博中出現的詞頻(出現次數).
	N：微博總數
	DF：詞條在多少個微博中出現過
	--------------------------------
 *   第一個MR，計算TF和計算N(微博總數)
 * @author root
 *
 */
public class FirstMapper extends Mapper<LongWritable, Text, Text, IntWritable>{

	protected void map(LongWritable key, Text value,Context context)
			throws IOException, InterruptedException {
		//value是微博檔案每一行以製表符\t隔開
		String[]  v =value.toString().trim().split("\t");
		if(v.length>=2){
			String id=v[0].trim();
			String content =v[1].trim();
			//對微博內容進行中文分詞處理
			StringReader sr =new StringReader(content);
			IKSegmenter ikSegmenter =new IKSegmenter(sr, true);
			Lexeme word=null;
			while( (word=ikSegmenter.next()) !=null ){
				String w= word.getLexemeText();//w就是微博內容的每一個詞彙
				//輸出格式為：key為：詞彙_微博ID    value是1，出現次數
				context.write(new Text(w+"_"+id), new IntWritable(1));
			}
			//每執行一次這個方法，就表示統計了一條微博數，將來在第四個reduce分割槽執行，參見FirstPartition，自定義分割槽規則
			context.write(new Text("count"), new IntWritable(1));
		}else{
			System.out.println(value.toString()+"-------------");
		}
	}
	
	
	
}

FirstPartition.java

自定義分割槽，使得key為count的分割槽到最後一個分割槽(編號3),其他的分別分割槽編號為0/1/2三個reduceTask

package com.jeff.mr.tf;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.lib.partition.HashPartitioner;

/**
 * 第一個MR自定義分割槽，把key為count的，即用來計算微博總數的資料分割槽到第四個reduce分割槽，
 * 前三個reduce分割槽用來計算TF，就是單個微博中詞彙出現次數
 * @author root
 *
 */
public class FirstPartition extends HashPartitioner<Text, IntWritable>{

	
	public int getPartition(Text key, IntWritable value, int reduceCount) {
		if(key.equals(new Text("count")))
			return 3;
		else
			return super.getPartition(key, value, reduceCount-1);
	}

}

FirstReduce.java

計算單個詞條的詞頻TF，輸入資料為FirstMapper.java的輸出，key為詞條_id.或者count，值為詞頻個數或者count個數，當key為count時不參與計算只輸出檢視。

輸出格式：詞條_ID 詞頻

package com.jeff.mr.tf;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
/**
 * c1_001,2
 * c2_001,1
 * count,10000
 * @author root
 *
 */
public class FirstReduce extends Reducer<Text, IntWritable, Text, IntWritable>{
	
	protected void reduce(Text arg0, Iterable<IntWritable> arg1,
			Context arg2)
			throws IOException, InterruptedException {
		
		int sum =0;
		for( IntWritable i :arg1 ){
			sum= sum+i.get();
		}
		if(arg0.equals(new Text("count"))){
			System.out.println(arg0.toString() +"___________"+sum);
		}
		arg2.write(arg0, new IntWritable(sum));
	}

}

在dfs-location上新建路徑：/usr/input/tf-idf並上傳檔案微博內容：

接下來就可以執行FirstJob.java來執行第一個MR：

package com.jeff.mr.tf;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


public class FirstJob {

	public static void main(String[] args) {
		Configuration config =new Configuration();
		config.set("fs.defaultFS", "hdfs://node4:8020");
		config.set("yarn.resourcemanager.hostname", "node4");
		try {
			FileSystem fs =FileSystem.get(config);
//			JobConf job =new JobConf(config);
			Job job =Job.getInstance(config);
			job.setJarByClass(FirstJob.class);
			job.setJobName("weibo1");
			
			job.setOutputKeyClass(Text.class);
			job.setOutputValueClass(IntWritable.class);
//			job.setMapperClass();
			job.setNumReduceTasks(4);
			job.setPartitionerClass(FirstPartition.class);
			job.setMapperClass(FirstMapper.class);
			job.setCombinerClass(FirstReduce.class);
			job.setReducerClass(FirstReduce.class);
			
			
			FileInputFormat.addInputPath(job, new Path("/usr/input/tf-idf"));
			
			Path path =new Path("/usr/output/weibo1");
			if(fs.exists(path)){
				fs.delete(path, true);
			}
			FileOutputFormat.setOutputPath(job,path);
			
			boolean f= job.waitForCompletion(true);
			if(f){
				
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

執行成功：

重新整理DFS-Location，看到在/usr/output/weibo1的目錄下生成了四個分割槽檔案，每一個分割槽檔案都是四個reduceTask的輸出檔案

其中第四個分割槽檔案就是用來計算Count微博總數N的，其他三個都是微博中詞彙即出現次數。

比如：0.03元_3824213951437432 1

這個就表示0.03元這個詞在ID為3824213951437432微博中出現了1次

TwoMapper.java

統計DF，詞條在多少個微博中出現過

輸出格式：詞條出現的微博個數

package com.jeff.mr.tf;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;
//統計df：詞在多少個微博中出現過。
public class TwoMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

	protected void map(LongWritable key, Text value, Context context)
			throws IOException, InterruptedException {

		/**
		 * 1  獲取當前	mapper Task的資料片段（split）
		 * 2 當前mapper Task的資料來源於第一個MR輸出的四個檔案
		 */
		FileSplit fs = (FileSplit) context.getInputSplit();
		//可以從fs獲取第一個MR的檔名，除了最後一個檔案是用來計算微博總數的，其他都是TF
		if (!fs.getPath().getName().contains("part-r-00003")) {
			String[] v = value.toString().trim().split("\t");
			if (v.length >= 2) {
				//獲取{0.03元_3824213951437432	1}，這種第一個MR的輸出資料，即每一行
				String[] ss = v[0].split("_");
				if (ss.length >= 2) {
					String w = ss[0];//得到每一個詞彙，輸出次數1，此處所有微博的詞彙都會輸出1次
					context.write(new Text(w), new IntWritable(1));
				}
			} else {
				System.out.println(value.toString() + "-------------");
			}
		}

	}
}

TwoReduce.java

package com.jeff.mr.tf;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

/**
 * 計算詞彙在所有微博中出現的次數
 * @author jeffSheng
 * 2018年10月17日
 */
public class TwoReduce extends Reducer<Text, IntWritable, Text, IntWritable>{
	/**
	 * 輸入資料：
	 *    key：0.03元	  value：1(次)
	 * Iterable<IntWritable> arg1，即key相等的一組資料
	 */
	protected void reduce(Text key, Iterable<IntWritable> arg1,Context context)
												throws IOException, InterruptedException {
		int sum =0;
		for( IntWritable i :arg1 ){
			sum= sum + i.get();
		}
		context.write(key, new IntWritable(sum));
	}

}

執行TwoJob.java第二個MR，計算每個詞彙在所有微博出現次數即DF

package com.jeff.mr.tf;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


public class TwoJob {

	public static void main(String[] args) {
		Configuration config =new Configuration();
		config.set("fs.defaultFS", "hdfs://node4:8020");
		config.set("yarn.resourcemanager.hostname", "node4");
		try {
//			JobConf job =new JobConf(config);
			Job job =Job.getInstance(config);
			job.setJarByClass(TwoJob.class);
			job.setJobName("weibo2");
			//設定map任務的輸出key型別、value型別
			job.setOutputKeyClass(Text.class);
			job.setOutputValueClass(IntWritable.class);
//			job.setMapperClass();
			job.setMapperClass(TwoMapper.class);
			job.setCombinerClass(TwoReduce.class);
			job.setReducerClass(TwoReduce.class);
			
			//mr執行時的輸入資料從hdfs的哪個目錄中獲取
			FileInputFormat.addInputPath(job, new Path("/usr/output/weibo1"));
			FileOutputFormat.setOutputPath(job, new Path("/usr/output/weibo2"));
			
			boolean f= job.waitForCompletion(true);
			if(f){
				System.out.println("執行job成功");
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

重新整理DFS-Location看到/usr/output/weibo2下的DF輸出檔案：

比如0.03元在所有微博中出現了1次

根據公式計算微博詞彙權重：

LastMapper.java

輸入資料為所有詞的TF，所有詞的DF，微博總數N，根據這三個變數計算詞條最終權重。

輸出格式：微博ID 詞條:權重

package com.jeff.mr.tf;

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.net.URI;
import java.text.NumberFormat;
import java.util.HashMap;
import java.util.Map;

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;

/**
 * 最後計算
 * @author root
 *
 */
public class LastMapper extends Mapper<LongWritable, Text, Text, Text> {
	//存放微博總數
	public static Map<String, Integer> cmap = null;
	//存放df
	public static Map<String, Integer> df = null;

	// 在map方法執行之前,即mapperTask初始化的時候執行
	/**
	 * mapReduce的執行過程回顧：
	 * 比如一個檔案被分割成1024個碎片段，則一定有與之對應的1024個mapTask去執行每個碎片段。
	 * mapTask在有碎片段的節點上執行，即 dataNode上有碎片段，在dataNode上執行。所以每個DataNode上就
	 * 有一個NodeManager來執行mapReduce程式，NodeManager裡面有一個與之對應的ApplicationMatser
	 * 負責從resourceManager中請求資源即Contianer中文是容器，其實是資源。申請資源後，ApplicationMatser
	 * 則可以通過一個Executor物件執行mapperTask，並監控和記錄執行狀態、進度等資料彙報給NodeManager，NodeManager
	 * 再彙報給resourceManager。
	 * Executor物件執行mapperTask的時候先初始化對應的MapTask，其實就是我們的LastMapper.
	 * java自定義的xxxMapper，只要初始化成功就呼叫LastMapper的setUp方法，這個時候map方法還沒執行，
	 * map方法是迴圈呼叫的，即每一行都呼叫一次，但是setUp方法只會呼叫一次。不過1024個碎片段對應1024個mapTask，
	 * 就會執行setup方法1024次，還是狠多次，所以我們可以考慮從共享記憶體中取得一部分資料，比如微博總數N和DF記錄。
	 * 我們使用cmap和df兩個Map來存放，判斷是否為空，即保證存過就不用再存了。
	 * 
	 * 
	 */
	protected void setup(Context context) throws IOException,
			InterruptedException {
		System.out.println("******************");
		if (cmap == null || cmap.size() == 0 || df == null || df.size() == 0) {
			URI[] ss = context.getCacheFiles();
			if (ss != null) {
				for (int i = 0; i < ss.length; i++) {
					URI uri = ss[i];
					if (uri.getPath().endsWith("part-r-00003")) {//微博總數
						Path path =new Path(uri.getPath());
//						FileSystem fs =FileSystem.get(context.getConfiguration());
//						fs.open(path);
						BufferedReader br = new BufferedReader(new FileReader(path.getName()));
						String line = br.readLine();
						if (line.startsWith("count")) {
							String[] ls = line.split("\t");
							cmap = new HashMap<String, Integer>();
							cmap.put(ls[0], Integer.parseInt(ls[1].trim()));
						}
						br.close();
					} else if (uri.getPath().endsWith("part-r-00000")) {//詞條的DF
						df = new HashMap<String, Integer>();
						Path path =new Path(uri.getPath());
						BufferedReader br = new BufferedReader(new FileReader(path.getName()));
						String line;
						while ((line = br.readLine()) != null) {
							String[] ls = line.split("\t");
							df.put(ls[0], Integer.parseInt(ls[1].trim()));
						}
						br.close();
					}
				}
			}
		}
	}

	
	protected void map(LongWritable key, Text value, Context context)
			throws IOException, InterruptedException {
		FileSplit fs = (FileSplit) context.getInputSplit();
//		System.out.println("--------------------");
		if (!fs.getPath().getName().contains("part-r-00003")) {
			String[] v = value.toString().trim().split("\t");
			if (v.length >= 2) {
				int tf =Integer.parseInt(v[1].trim());//tf值
				String[] ss = v[0].split("_");
				if (ss.length >= 2) {
					String w = ss[0];
					String id=ss[1];
					//根據公式計算權重，輸出：微博Id  詞彙1:權重1 詞彙2：權重2  
					double s=tf * Math.log(cmap.get("count")/df.get(w));
					NumberFormat nf =NumberFormat.getInstance();
					nf.setMaximumFractionDigits(5);
					context.write(new Text(id), new Text(w+":"+nf.format(s)));
				}
			} else {
				System.out.println(value.toString() + "-------------");
			}
		}
	}
}

LastReduce.java

計算所有詞條的最終權重，相同微博在後邊顯示其所有的詞條:權重，並使用製表符\t隔開。

輸出格式：微博ID 詞條:權重詞條:權重

package com.jeff.mr.tf;

import java.io.IOException;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class LastReduce extends Reducer<Text, Text, Text, Text>{
	
	protected void reduce(Text key, Iterable<Text> arg1,
			Context context)
			throws IOException, InterruptedException {
		
		StringBuffer sb =new StringBuffer();
		
		for( Text i :arg1 ){
			sb.append(i.toString()+"\t");
		}
		
		context.write(key, new Text(sb.toString()));
	}

}

執行LastJob計算最終輸出結果：

我們這裡採用的是在本地提交到Linux環境下進行執行測試的

package com.jeff.mr.tf;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


public class LastJob {

	public static void main(String[] args) {
		Configuration config =new Configuration();
//		config.set("fs.defaultFS", "hdfs://node1:8020");
//		config.set("yarn.resourcemanager.hostname", "node1");
		config.set("mapred.jar", "C:\\Users\\Administrator\\Desktop\\weibo3.jar");
		try {
			FileSystem fs =FileSystem.get(config);
//			JobConf job =new JobConf(config);
			Job job =Job.getInstance(config);
			job.setJarByClass(LastJob.class);
			job.setJobName("weibo3");
			
//			DistributedCache.addCacheFile(uri, conf);
			//2.5
			/**
			 * 之所以以下兩行可以載入到記憶體因為微博總數的檔案和df檔案其實都不大，所有可以在任務啟動之初先載入到記憶體
			 */
			//把微博總數N載入到記憶體
			job.addCacheFile(new Path("/usr/output/weibo1/part-r-00003").toUri());
			//把df載入到記憶體
			job.addCacheFile(new Path("/usr/output/weibo2/part-r-00000").toUri());
			
			//設定map任務的輸出key型別、value型別
			job.setOutputKeyClass(Text.class);
			job.setOutputValueClass(Text.class);
//			job.setMapperClass();
			job.setMapperClass(LastMapper.class);
			job.setReducerClass(LastReduce.class);
			
			//mr執行時的輸入資料從hdfs的哪個目錄中獲取
			FileInputFormat.addInputPath(job, new Path("/usr/output/weibo1"));
			Path outpath =new Path("/usr/output/weibo3");
			if(fs.exists(outpath)){
				fs.delete(outpath, true);
			}
			FileOutputFormat.setOutputPath(job,outpath );
			
			boolean f= job.waitForCompletion(true);
			if(f){
				System.out.println("執行job成功");
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

需要做的是將工程打包放在桌面weibo3.jar,然後在LastJob中新增：

config.set("mapred.jar", "C:\\Users\\Administrator\\Desktop\\weibo3.jar");

配置檔案放在src下：

開始執行：

開啟：http://node1:18088/cluster

觀察剛開始執行

觀察執行完成;

重新整理DFS-Location

比如：3823890239358658 繼續:4.89035 支援:3.04452

表示在微博ID為3823890239358658微博中，[繼續]的全部微博中權重為4.89035，[支援]的全部微博中權重為3.04452

有了這些結果，我們就可以做出一些商業或者其他領域的重要選擇！

當然也可以在本地進行測試，就是在LastMapper的setUp中註釋掉的程式碼：

FileSystem fs =FileSystem.get(context.getConfiguration());

FSDataInputStream fsdInputStream = fs.open(path);

將輸入流封裝進BufferedReader即可。

案例5-挖掘微博廣告高權重詞條

微博內容（如圖）：ID content 公式： TF:詞條在某個微博中出現的詞頻(出現次數). N：微博總數 DF：詞條在多少個微博中出現過案例用到四個reduceTask,下標計數從0開始，三個統計詞頻TF，一個統計微博總數N。

Hadoop單點部署與案例開發（微博用戶數據分析）

環境搭建 hadoop 數據分析微博用戶一、環境搭建1、Hadoop運行環境搭建1.1 安裝虛擬機（1）下載並安裝VMware虛擬機軟件。（2）創建虛擬機，實驗環境虛擬機配置如下圖所示。（3）安裝Ubuntu系統，安裝結果如下圖所示。1.2 配置JDK環境下載並安裝JDK，安裝結束後需對

獲取微博廣告博文數據

frame count div tope comm spa sin post .data import requests import json import pandas as pd import time import re headers = { ‘Us

微博廣告分層實驗平臺(Faraday)架構實踐

移動網際網路廣告基於大資料，實現廣告的精準人群定向投放和效果評估，並藉助於不可勝數的廣告策略，控制著廣告的實時投放，讓資料驅動型的移動網際網路廣告沿著站方、使用者、廣告主三者共贏的目標不斷前進。大資料驅動使得效果指標的量化評估成為了可能。為了實現好的廣告投放效率，線上執行的每一個廣告策略需要相應

OAuth2.0學習（5-1）新浪開放平臺-微博OAuth2.0認證

com blank weibo mage pen auth 平臺 target img http://open.weibo.com/wiki/%E9%A6%96%E9%A1%B5 OAuth2.0學習（5-1）新浪開放平臺-微博OAuth2.0認證

OAuth2.0學習（5-4）新浪開放平臺-微博API-使用OAuth2.0調用API

ons ive cin span 其他例如 bsp 檢驗應用使用OAuth2.0調用API 使用OAuth2.0調用API接口有兩種方式： 1、直接使用參數，傳遞參數名為 access_token URL 1 https://api.wei

第2次作業：微博案例分析

研究我不感受 tex .com 正是可能組成新用戶第一部分產品 1.1 產品名稱及使用平臺本次我選擇的產品名稱是微博，使用平臺為IOS。 1.2 選擇該產品進行分析的原因微博，顧名思義就是微型博客的簡稱，是一種通過關註機制分享簡短

因趙麗穎結婚，微博工程師受到的高併發挑戰

首先看看這個圖，需求是×××，測試用例是×××，上線了變成結婚，這能怪技術嗎？在網際網路公司做軟體開發，除了開發出高質量的軟體，給使用者愉快的體驗之外，能承受高併發的使用者訪問也是很有必要的，這就對軟體系統的架構有著一定的要求了，比如微博等各種媒體平臺，有時候因為一個熱點事件就可以讓平臺流量劇

新浪微博技術分享：微博實時直播答題的百萬高併發架構實踐

本文由“聲網Agora”的RTC開發者社群整理。 1、概述本文將分享新浪微博系統開發工程師陳浩在 RTC 2018 實時網際網路大會上的演講。他分享了新浪微博直播互動答題架構設計的實戰經驗。其背後的百萬高併發實時架構，值得借鑑並用於未來更多場景中。本文正文是對演講內容的整理，請繼

實戰案例-微博情感分析

實戰案例：微博情感分析資料：每個文字檔案包含相應類的資料 0：喜悅；1：憤怒；2：厭惡；3：低落步驟文字讀取分割訓練集、測試集特徵提取模型訓練、預測程式碼： tools.py # -*- coding: utf-8 -*- import re im

微博案例看利用jq對ajax的使用

主要技術棧後臺 wamp=Apache+Mysql+PHP5 前端 jquery-1.12.4.js jq-ajax jquery.cookie. 最終實現案例預覽由於本文主要講述前端jq中

MapReduce程式設計-新浪微博內容相關（內容廣告有效推薦）

通過之前的幾個MR程式的場景樣例，我們簡單瞭解了一些MR程式設計和離線計算的相關知識。這篇博文我們對MapReduce進行進一步的運用和解讀。案例場景：現在我們有一批新浪微博的資料資訊（當然，這裡的資料集是經過處理的，但並不影響我們的專案樣例編寫）。資料資

主題模型LDA及其在微博推薦&廣告演算法中的應用--第1期

因為原文偶爾會出現訪問不了的情況，所以特拷貝於此。 @吳宇WB 【前言】本篇文章中所涉及的大部分理論知識，都是由微博的推薦演算法和廣告演算法團隊共同收集，共同學習的，而現在這兩個團隊也合併成為一個更大的-

Android之高仿騰訊微博

匯入原始碼到eclipse出現報錯的童鞋注意：我用的是utf-8編碼，因為騰訊的api是utf-8編碼，其實我也不喜歡改來該去的！國慶後，一直在忙，都沒有什麼時間做自己的事情，哎，上班的孩子傷不起啊！這個微博也是斷斷續續的，每天晚

關於爬取新浪微博，記憶體耗用過高的問題

最近在做網際網路輿情分析時，需要爬取新浪微博做相關實驗。雖然新浪微博開放了相關輿論的API，然而申請什麼的，並不想做，而且輿情變化快，最終還是自己爬取，相關輿情。在用selenium的時候，有時候經常發現記憶體耗

Android端IM應用中的@人功能實現：仿微博、QQ、微信，零入侵、高可擴充套件

本文由“貓爸iYao”原創分享，感謝作者。 1、引言最近有個需求：評論@人（沒錯，就是IM聊天或者微博APP裡的@人功能），就像下圖這樣： ▲ 微信群聊介面裡的@人功能 ▲ QQ群聊介面裡的@人功能網上已經有一些文章分享了類似功能實現邏輯，但是幾乎都是

基於redis分散式快取實現（新浪微博案例）

第一：Redis 是什麼？ Redis是基於記憶體、可持久化的日誌型、Key-Value資料庫高效能儲存系統，並提供多種語言的API. 第二：出現背景資料結構(Data Structure)需求越來越多, 但memcache中沒有, 影響開發效率效能需求, 隨

突發熱點事件下微博高可用註冊中心vintage的設計&實踐

文章概要當前微博服務化採用公有云＋私有云的混合雲部署方式，承載了每天百億級的流量，vintage 作為微博微服務的註冊中心，為管理 10w 級微服務節點以及在流量激增情況下的服務快速擴縮容，面臨了極大挑戰。例如：複雜網路條件下 vintage 服務的高可用保障、解決大批量節點狀態變更觸

iOS-仿赤兔、新浪微博動態列表（帶評論、點贊、轉發和分享,自動計算行高功能）

最近有空整理一下專案,做了一個仿赤兔、新浪微博動態列表（帶評論、點贊、轉發和分享,自動計算行高功能）的DEMO。HKPTimeLine ,喜歡的可以star一下哦。使用到的第三方框架有:Masonry,HYBMasonryAutoCe

新浪微博千萬級規模高效能、高併發的網路架構經驗分享

架構以及我理解中架構的本質在開始談我對架構本質的理解之前，先談談對今天技術沙龍主題的個人見解，千萬級規模的網站感覺數量級是非常大的，對這個數量級我們戰略上要重視它，戰術上又要藐視它。先舉個例子感受一下千萬級到底是什麼數量級？現在很流行的優步(Uber)，從媒體

案例5-挖掘微博廣告高權重詞條

相關推薦