介紹一下CPU的儲存層次
外存、記憶體、多級快取、寄存器。 如何充分利用CPU緩衝機制。
提升代碼的時間局部性和空間局部性 GPU架構
大核、小核、全域記憶體、共用記憶體、線程、線程塊、線程網格 用到了哪些C++11的新特性。
auto、lambda、move、shared_ptr、、、 介紹一下Static修飾符。說一下Static全域變數,局部變數,成員變數的初始化時機。
全域變數、成員變數的初始化是在main函數之前。
局部變數是在第一次執行代碼時初始化。 多線程的同步機制有哪些。
互斥鎖、訊號量、事件、訊息、臨界區、、、 什麼是共用記憶體。
將一塊實體記憶體同時映射到兩個進程的地址空間中。 New出來的變數是不是一定儲存在實體記憶體中。
不是,在堆上申請,有可能是虛擬記憶體,然後在實際操作的時候,需要把資料調入 實體記憶體中,這個過程是系統負責的。 VS記憶體分析工具用過沒。
沒有 OpenMP的常用命令
#pragma omp parallel #pragma omp parallel for private(x)
OpenMP和MPI的區別。
OpenMP和MPI是並行編程的兩個手段,
對比如下:
OpenMP:線程級(並行粒度);共用儲存;隱式(資料分配方式);可擴充性差;
MPI:進程級;分布式儲存;顯式(資料分配方式);可擴充性好。
OpenMP採用共用儲存,意味著它只適應於SMP,DSM機器,不適合於叢集。
MPI雖適合於各種機器,但它的編程模型複雜:需要分析及劃分應用程式問題,並將問題映射到分布式進程集合;需要解決通訊延遲大和負載不平衡兩個主要問題;
調試MPI程式麻煩;MPI程式可靠性差,一個進程出問題,整個程式將錯誤;
作者:李超錚
連結:https://www.zhihu.com/question/20188244/answer/14552204
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。 演算法題:1-n的數字,每個數字只出現一次,如果有一個數字變為了另一個數字,如何找出這個變化了的數字本來應該是多少。
方法1:快速排序後遍曆尋找跳變的數字
方法2:開闢一個n大小的新數組B,初始化為全0,遍曆原始數組A,將B[A[i]]置為1;最後遍曆B數組,若B[k] == 0,則k為所尋。 進階題:如果數字特別多呢。一個10G的大小的數字檔案,如何找出這個跳變的數字。
方法1:先將10G的檔案分為100個小檔案,先對每個小檔案排序,然後歸併排序,最後遍曆排好序的數組,尋找跳變的值。
方法2:散列分治:
使用A[i]/(n/100)作為散列值,將所有的數字按散列值分到100個不同的小檔案中。
然後問題轉化位前一個常規的問題。
如果可以直接獲得小檔案的數字個數,則可以快速定位變化的值應該在哪個小檔案中。