字串演算法 —— 兩字串相同的單詞

阿新 • • 發佈：2018-12-12

1. navie：集合 intersect

以集合的形式分別存放兩字串，然後求集合交集。

def common_words_naive(str1, str2):
	str1_set = set(str1.strip().split())
	str2_set = set(str2.strip().split())
	return str1_set & str2_set			# 集合 intersect

>> common_words_naive('I love word', 'I love China')
{'I', 'love'}

2. 使用 hash

根據字串hash演算法，對字串1的單詞分別求其hash值，時間空間複雜度均為 $O$

(n)O(n) $O (n)$ ，並將hash值，存放在集合中

遍歷字串2中的單詞，求其hash值，判斷是否在字串1的hash集合中，如果是，則為 common words

def bkdr_hash(str, seed=131):
    hash = 0
    for s in str:
        hash = hash*seed + ord(s)
    return hash & 0x7fffffff

將字串hash為整數值的方法及其對比見種字串Hash函式比較

def common_words_hash(str1, str2):
    words = str1.strip().split(' ')
    str1_hashset = set(bkdr_hash(word) for word in words)
    common_words = []
    for word in str2.strip().split(' '):
        if bkdr_hash(word) in str1_hashset:
            common_words.append(word)
    return common_words
    
>> common_words_hash('I love word', 'I love China')
{'I', 'love'}

references

字串演算法 —— 兩字串相同的單詞

1. navie：集合 intersect 以集合的形式分別存放兩字串，然後求集合交集。 def common_words_naive(str1, str2): str1_set = set(str1

兩個字串中最大相同的子串

求得短的字串和長的字串兩個字串中相同的字串段。 public static String getMaxSubString(String s1, String s2) { String

HDU2594 （kmp，求兩字串的前後綴相同長度最大,水題）

Homer: Marge, I just figured out a way to discover some of the talents we weren’t aware we had. Marge: Yeah, what is it?&nbs

求任意兩個字串的最大相同子串

c語言# include<stdio.h> #include<string.h> int main(){ char a[100],b[100]; printf("s1="); scanf("%s",a); printf("s2="); s

資料結構演算法題/字串按照單詞翻轉要求空間複雜度O(1)

/** * 先直接逆序，這樣確保最後那個單詞在前面了，只不過此時單詞是逆序的 * 然後再對每個逆序的單詞進行調整 */ public class StringWordReverse { public String wordReverse(String str){ //在

編寫程式，獲取兩個字串中最大相同子串

private void test() { String a = "Valaienie"; String b = "Maierginle"; String max = a.length() > b.length() ? a : b; String min =

小程式求兩字串中是否有相同字元

#include<stdio.h> #include bool fun(const char *a, const char *b,int len) { int m = 0; for (int i = 0;i <len ;i++) { m = m^a[i] ^ b[i];

【死磕演算法·字串問題】字串單詞間逆序

題目大意：給定字串表示的句子，在單詞間做逆序調整。單詞內部字元次序不變。如“cat loves dog” 變化結果為“dog loves cat” 思路： 1、實現字串內部任意區間內所有字元逆序的函式f 2、用f處理整個字串為“god sevol tac” 3、找到逆序大字串

Java程式碼實現餘弦相似度演算法比較兩字串相似度

因工作需要比較兩個兩個字串的相似度比較，由於最短編輯距離演算法不符合需求，就又找其他演算法，在網上看到了另一個演算法：餘弦相似度演算法。於是學習了一下，並寫篇部落格儲存，以便學習以及日後用到。程式碼如下: import java.util.HashMap im

SQL Server對比兩字串的相似度（函式演算法）

ALTER FUNCTION FNStrCompare (@Val1 VARCHAR(50),---比較字串1 @Val2 VARCHAR(50),---比較字串2 @Break VARCHAR(10) ---分隔符 ) RETURNS INT AS BEGIN DECLARE @

資料結構演算法題/單個字串，兩個字串，多個字串相關演算法題

1 一個字串 1.1 最長迴文子串 https://blog.csdn.net/fkyyly/article/details/83541767 1.2 最長重複子串 https://blog.csdn.net/fkyyly/article/details/83508168 1.3

演算法學習——動態規劃例題：兩字串轉換權最小問題（java）

題目：給定兩個字串str1和str2,再給定三個整數ic,dc和rc,分別代表插入，刪除和替換一個字元的代價。返回將str1編輯成str2的最小代價。比如，str1="abc",str2="adc",ic=5,dc=3,rc=2.從"abc"編輯成adc, 吧b替換成d是代價最小的所以返回

輸出兩字串最大相同部分——C面試題

面試題，是紙上寫的，發現了些錯誤，回來改進了下。寫紙上和寫計算機裡並編譯成功完全是兩個效果。開始沒太多字串操作，很繁瑣、難點也多，後逐漸改進。典型問題1： sizeof()侷限於棧陣列 char a[] = "asd213123123"; 形式，並且這種不能用'\0'

String包裝類應用之獲取兩字串的最大相同子串

exa: 1.獲取兩個字串中最大相同子串。比如： str1 = “abcwerthelloyuiodef”; str2 = “cvhellobnm” 提示：將短的那個串進行長度依次遞增的子串與

[演算法]兩種字串匹配演算法（索引法，KMP演算法）對比，C語言實現

今天做了個一個簡單的字元對比程式，功能是實現從A串刪除包含B最多的字元的操作，比如A=“aaaaabbbbbbabababa” B=“aaccbaab”，應當刪除“aab”的，不是aa，相信知道搜尋引擎的朋友肯定是知道的吧，這種演算法主要用於去除頁面中無效的關鍵字，來減少收錄的計算消耗的一種方法，好了，具體演

運用遞迴判斷兩字串是否相同

#include<iostream> using namespace std; bool f(string a,string b){ if(a.length() != b.length()){ return false; } if(a.length

用javascript求兩個字串最大的相同的子串

思路： 1.找出兩個字串的最大和最小字串（根據長度）。 2.從最小的字串中先取該字串的長度的子串，判斷大的字串中是否包含該子串，不包含將長度減1，從小的字串中取該長度的子串再去判斷，如此反覆。 &

兩字串尋找最大相同子串

1.s1.contains(sub) 存在返回true2.把較短字串先與長的contains，存在則輸出；不存在則減一再containspublic class StringTest_3 {public static void main(String[] args) {St

【動態規劃】LCS演算法：求兩字串最大公共字串（連續）

LCS演算法的應用問題描述：求兩字串的連續最大公共子字串思路：根據上文LCS演算法求解兩字串的最大公共子序列（不連續），可以得到求解連續子字串的啟示，如圖所示，構造LCS矩陣vec，將兩個字串按矩

兩個字串是否是由相同字母（出現次數也相同）組成的

Given two strings s and t, write a function to determine if t is an anagram of s. For example,s = "anagram", t = "nagaram", return tru

字串演算法 —— 兩字串相同的單詞

1. navie：集合 intersect

2. 使用 hash

references

相關推薦