1. 程式人生 > >python工程師(web開發和爬蟲方向)-面試經歷

python工程師(web開發和爬蟲方向)-面試經歷

  • 是否瞭解執行緒的同步和非同步?
  • 是否瞭解網路的同步和非同步?
  • 連結串列和順序表儲存時各自有什麼優點?
  • 使用redis搭建分散式系統時如何處理網路延遲和網路異常?
  • 資料倉庫是什麼?
  • 假設有一個爬蟲,從網路上獲取資料的頻率快,本地寫入資料的頻率慢,使用什麼資料結構好?
  • 你是否瞭解谷歌的無頭瀏覽器?
  • 你是否瞭解MySQL資料庫的幾種引擎?
  • redis資料庫有哪幾種資料結構?
  • 二、這家是做網路電視應用(教育/遊戲等)的後臺(.APK)

    1. 是否瞭解django中的manage.py自定義的用法?
    2. django的常用功能有哪些?
    3. django有哪些優勢?
    4. 是否對django的admin進行定製過?
    5. 在django中有使用過原生sql語句嗎?(查了一下可能是涉及到ORM的效能優化)

    三、做大資料徵信業務的公司,招django工程師

    1. django有什麼優點?
    2. 是否瞭解django admin定製?
    3. 描述一下你的專案。

    四、做銀行/金融業決策系統,招django工程師

    1. 詳細描述一下做某個專案的過程,描述的是一個爬蟲專案的過程
    2. 是否有對爬蟲採集結果進行資料分析,有哪些?
    3. 假設現在資料已經爬取完成,需要開發一個介面給使用者,你會設定哪些篩選維度?(薪資,地點,職位關鍵詞等)
    4. 篩選維度設計好後,現在需要在使用者輸入某個維度的條件後查詢與使用者查詢目標最為匹配的條目,如何設計查詢邏輯演算法?(拿薪資舉例,以500為區間建立引索,將薪資的下限和上限存入每個區間裡面,不能有冗餘空間。以使用者查詢值為基準,逆序查詢指定個數的條目,前端顯示最相關的資料。需要處理非500倍數的值。)
      據實際例子去想解決思路,喜歡這種面試方式。
    5. 決策系統的某個模組的資料結構如何設計?(使用向量集)