比斯特
顯示工作的相關歷程資訊
用法概要
bhist [-l [-aff] [-gpu] [-hostfile]] [-a] [-b] [-d] [-data] [-e] [-p] [-r] [-s] [-w] [-UF] [-cname] [-app application_profile_name] [-C start_time,end_time] [-D start_time,end_time] [-f logfile_name | -f - | -n number_logfiles | -n number_blocks | -n min_logfile, max_logfile | -n 0] [-S start_time,end_time] [-J job_name] [-Jd "job_description"] [-Lp ls_project_name] [-m "host_name ... "] [-N host_name | -N host_model | -N CPU_factor] [-P project_name] [-q queue_name] [-u user_name | -u all | -G user_group] [job_ID ... |"job_ID[index] " ...]說明
依預設,會顯示您自己的擱置中、執行中及已暫停工作的相關資訊。 依工作分組資訊。 CPU 時間未正規化。 bhist 指令會搜尋 LSF 系統所使用的事件日誌檔: $LSB_SHAREDIR/cluster_name/logdir/lsb.events。 bhist 指令也會顯示過去一週發生的事件。 將環境變數 LSB_Bhist_hours 設為替代時數 (僅使用 -t 選項。)
選項
- -a
- 顯示已完成及未完成工作的相關資訊。
此選項會置換 -d、 -p、 -s及 -r。
- -阿夫
- 顯示工作中每一個作業具有 CPU 及記憶體親緣性資源需求之工作的相關歷程工作資訊。 如果工作處於擱置狀態,則會顯示所要求的親緣性資源。 對於執行中工作,也會顯示有效且結合的親緣性資源配置,以及表格標題AFFINITY. 此表格顯示每一個作業的詳細記憶體及 CPU 連結資訊,每一個已配置處理器單元一行。 對於已完成的工作 (EXIT或DONE狀態) ,即會顯示工作的親緣性需求,以及有效及結合的親緣性資源需求詳細資料。
此選項只能與 -l 選項搭配使用。
- -b
- 簡短格式。
- -cname
- 在 IBM® Spectrum LSF Advanced Edition中,包括輸出中執行叢集主機及主機群組的叢集名稱。
- -d
- 顯示已完成工作的相關資訊。
- -data
- 顯示具有資料需求之工作 (例如,使用 -data提交的工作) 的歷程資訊。 bhist -data 選項充當過濾器,只顯示具有資料需求的工作。
bhist -data Summary of time in seconds spent in various states: JOBID USER JOB_NAME PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL 1962 user1 *1000000 410650 0 0 0 0 0 410650 - -e
- 顯示已結束工作的相關資訊。
- -hostfile
- 如果使用 bsub -hostfile 選項提交工作,或使用 bmod -hostfile 選項修改工作以指向使用者指定的主機檔,則 bhist -l -hostfile 選項會顯示使用者指定的主機檔路徑。 -hostfile 選項也會顯示主機檔的內容。
- -gpu
bhist -l -gpu 顯示工作完成之後 GPU 工作配置的下列相關資訊:
此選項只能與 -l 選項搭配使用。
- 主機名稱
- 主機的名稱。
- 主機上的 GPU ID
- 每一個 GPU 都顯示為個別行。
- TASK 及 ID
- 使用 GPU 的工作作業及 ID 清單 (如果有多個作業使用,則以逗點區隔)
- MODEL
- 包含 GPU 品牌名稱及模型類型名稱。
- MTOTAL
- GPU 記憶體大小總計。
- GPU 計算功能
- MRSV
- 工作保留的 GPU 記憶體
- SOCKET
- GPU 的 Socket ID 位於
- NVLINK
- 指出 GPU 是否與配置給工作的其他 GPU (依 GPU ID 及包括其本身來分級) 具有 NVLink 連線。 每一個 GPU 的連線旗標都是以 "/" 與下一個 GPU 區隔的字元:
如果工作因 GPU 相關錯誤或警告而異常結束,則會顯示錯誤或警告訊息。 如果 LSF 無法從 DCGM 取得 GPU 使用情形資訊,則會使用連字號 (-) 顯示畫面。
- -l
- 長格式。
如果使用 bsub -K 選項提交工作,則會顯示 -l 選項Synchronous execution.
如果您使用 OR (||) 表示式來提交工作以指定替代資源,則此選項會顯示成功Execution rusage執行工作的字串。
如果您針對 order、 same、 rusage及 select 區段使用 bsub -R 選項來提交具有多個資源需求字串的工作,則 bhist -l 指令會顯示那些區段的單一合併資源需求字串,就像它們是使用單一 -R 選項提交一樣。
使用 bsub -a (或使用 bmod -a修改) 以 esub (或 epsub) 提交的工作將顯示 bhist -l 輸出中用於執行的最新 esubs ,首先使用預設值,然後使用使用者 esubs。 如果使用者指定的 esub Script 與預設 esub Script 相同,則重複的 esubs 會顯示為一個項目。 如果使用包含參數的 esub 提交工作,則 esub 及其參數也會顯示在 bhist -l 中,且 esub 的格式與工作提交中指定的格式相同。
長格式包括下列資訊:- 工作結束碼。
- 已終止工作的結束原因。
- 工作異常狀況 (例如,如果工作執行時間超出執行時期預估,則工作異常狀況為runtime_est_exceeded顯示)。
- 可調整大小的工作資訊。
- SSH X11 轉遞資訊 (-XF)。
- 指定及執行現行工作目錄 (CWD)。 會顯示完整路徑,包括目錄型樣值。
- 具有資料需求之工作的詳細資訊。 標題DATA REQUIREMENTS之後會顯示工作所要求的檔案或標籤清單,以及對資料需求所做的任何修改。
- 使用者指定結束、停止或回復工作的原因。
- 發出結束、停止或回復工作要求的主機。
- 工作層次擱置時間限制及合格擱置時間限制。
- 記憶體及 CPU 使用率資訊,例如 CPU 效率、CPU 尖峰使用率及記憶體效率值。
- 在工作啟動之後,如果 lsb.params 檔案中的 TRACK_ELIGIBLE_PENDINFO 參數設為 Y 或 y,則工作處於合格及不合格擱置狀態所花費的時間量。
- 適用的借出資訊。 此資訊顯示工作是否使用從 GSLA 資源儲存區借用的資源,以及從中借用資源的儲存區。
- LSF 資源連接器的帳戶名稱。
- 從 Fix Pack 14 開始,指派給每一個工作的資源名稱。
- 由於下列 bmod 指令選項而對擱置中工作所做的變更:
- 絕對優先順序排程 (-aps | -apsn)
- 可自動調整大小的工作屬性 (-ar | -arn)
- 現行工作目錄 (-cwd)
- 資料需求 (-data | -datan)
- 後置執行指令 (-Ep | -Epn)
- 工作說明 (-Jd | -Jdn)
- 檢查點選項 (-k | -kn)
- 移轉臨界值 (-mig | -mign)
- 工作調整大小通知指令 (-rnc | -rncn)
- 使用者限制 (-ul | -uln)
- 執行時期預估 (- |-溫)
bhist -l 指令會顯示 GPU 配置的有效 GPU 需求字串。bhist -l Job <204>, User <user1>, Project <default>, Command <blaunch sleep 60> Wed Jul 12 22:40:54: Submitted from host <hosta>, to Queue <normal>, CWD </ scratch/user1>, 8 Task(s),Requested Resources <span[ptile=4] .....................rusage[ngpus_physical=4]>,Specified Hosts <hostb>, <hosta!>, Requested GPU <num=4:mode=shared:j_exclusive=yes>; Wed Jul 12 22:40:55: Dispatched 8 Task(s) on Host(s) <hosta> <hosta> <h hosta> <hosta> <hostb> <hostb> <hostb> <hostb>, Allocated 8 Slot(s) on Host(s) <hosta> <h hosta> <hosta> <hosta> <hostb> <hostb> <hostb> <hostb>, Effective RES_REQ <select[type == any] order[r15s:pg] rusage[ngpus_physical=4.00] span[ptil e=4] >; Wed Jul 12 22:40:56: Starting (Pid 116194); Wed Jul 12 22:40:56: External Message "hostb:gpus=0,3,1,2;hosta:gpus=0,1,2,3; EFFECTIVE GPU REQ: num=4:mode=shared:mps=no:j_exclusive=yes;" was posted from "user1" to message box 0; - -p
- 顯示擱置中工作的相關資訊。
- -r
- 顯示執行中工作的相關資訊。
- -s
- 顯示已暫停工作的相關資訊。
- -t
- 依時間順序顯示工作事件,包括能源察覺排程事件JOB_PROV_HOST和HOST_POWER_STATUS.
依預設,只會顯示上週的記錄。 若為不同的時段,請搭配使用 -t 選項與 -T 選項。
搭配使用 LSB_BHIST_HOURS 與 -t ,以顯示現行時間之前的工作事件,其持續時間比預設一週更長或更短。
- -w
- 寬格式。 以寬格式顯示資訊。
- -UF
- 顯示未格式化的工作詳細資訊。
此選項可讓您輕鬆撰寫 Script ,以在 bhist上剖析關鍵字。 此選項的結果沒有輸出的廣泛控制。 每一行從行的開頭開始。 結尾沒有任何分隔字元的資源使用訊息行會新增分號來區隔它們的不同組件。 第一行及以時間戳記開頭的所有行會以單行顯示未格式化。 輸出沒有行長度和格式控制。
- -app 應用程式設定檔名稱
- 顯示提交至指定應用程式設定檔之工作的相關資訊。
- -C start_time,end_time
- 顯示在指定時間間隔期間完成或結束的工作。 以格式指定時間yyyy/mm/dd/HH:MM. 不要在時間間隔字串中指定空格。 此選項會置換 -r、 -s、 -p及 -a 選項。
如需時間語法的相關資訊,請參閱 時間間隔格式。
- -D start_time,end_time
- 顯示在指定時間間隔期間分派的工作。 以格式指定時間yyyy/mm/dd/HH:MM. 不要在時間間隔字串中指定空格。
必須與 -a 選項搭配使用,因為它只會尋找執行中工作的結果。
如需時間語法的相關資訊,請參閱 時間間隔格式。
- -f logfile_name | -f-
- 搜尋指定的事件日誌,這對於離線分析很有用。 請指定絕對或相對路徑。
對於 UNIX ,指定的檔案路徑最多可以包含 4094 個字元,對於 Windows ,最多可以包含 255 個字元。
指定 -f- 選項,以強制 bhist 指令使用 lsb.events 日誌檔。 如果您使用 IBM Spectrum LSF Explorer (LSF Explorer) 來載入事件日誌記錄,則 -f- 選項 (或任何指定日誌檔的 -f 引數) 會強制 bhist 指令略過 LSF Explorer。
附註: bhist -cname、 -t及 -T 選項一律會略過 LSF Explorer ,並改為從 lsb.events 檔案取得資訊。如需使用 LSF Explorer 來載入事件日誌記錄的詳細資料,請參閱 lsf.conf 檔案中的 LSF_QUERY_ES_SERVERS 及 LSF_QUERY_ES_FUNCTIONS 參數。
- -G user_group
- 顯示與針對指定使用者群組使用 bsub
-G 指令提交之使用者群組相關聯的工作。 -G 選項不會顯示指定使用者群組內子群組中的工作。
-G 選項不能與 -u 選項一起使用。 您只能指定使用者群組名稱。 -G 選項不支援關鍵字 all 。
- -J 工作名稱
- 顯示具有指定工作名稱的工作。
工作名稱長度最多為 4094 個字元。 工作名稱不是唯一的。
萬用字元 (*) 可以在工作名稱內的任何位置使用,但不能出現在陣列索引內。 例如,型樣 job* 會傳回jobA和jobarray[1]. *AAA*[1] 型樣會傳回工作陣列中的第一個元素,其名稱包含AAA. 不過,型樣 job1[*] 不會傳回任何內容,因為萬用字元是在陣列索引內。
- -Jd "job_description"
- 顯示具有指定工作說明的工作。
工作說明長度最多為 4094 個字元。 工作說明不是唯一的。
萬用字元 (*) 可以在工作說明中的任何位置使用。
- -Lp ls_project_name
- 顯示屬於指定 LSF License Scheduler 專案之工作的相關資訊。
- -m "host_name..."
- 顯示分派給指定主機的工作。
- -n number_logfiles | -n min_logfile, max_logfile | -n 0
- 搜尋指定數目的事件日誌,從現行事件日誌開始,並以連續順序處理最新日誌。 指定 0 以指定 $(LSB_SHAREDIR)/cluster_name/logdir中的所有事件日誌檔,最多 100 個檔案。
如果您刪除檔案,則會中斷連續編號,且 bhist 指令無法存取較舊的檔案。 例如,如果您指定 3 , LSF 會搜尋 lsb.events、 lsb.events.1和 lsb.events.2 檔案。 如果您指定 4 , LSF 會搜尋 lsb.events、 lsb.events.1、 lsb.events.2及 lsb.events.3 檔案。 不過,如果遺漏 lsb.events.2檔案,則兩個搜尋都只會包含 lsb.events 和 lsb.events.1 檔案。
- -n number_blocks (僅限LSF Explorer )
- 如果您使用 LSF Explorer 來載入事件日誌記錄,請使用 -n 選項來控制 LSF Explorer 傳回的工作記錄數 (區塊記錄數)。 區塊大小在 LSF Explorer中配置。 如需使用 LSF Explorer 來載入事件日誌記錄的詳細資料,請參閱 lsf.conf 檔案中的 LSF_QUERY_ES_SERVERS 及 LSF_QUERY_ES_FUNCTIONS 參數。
- -N host_name | -N host_model | -N cpu_factor
- 依指定的 CPU 因數或依指定主機或主機型號的 CPU 因數將 CPU 時間正規化。
如果您直接在事件日誌上使用 bhist 指令,則必須指定 CPU 因數。
使用 lsinfo 指令來取得主機型號及 CPU 因數資訊。
- -P project_name
- 顯示屬於指定專案之工作的相關資訊。
- -q 佇列名稱
- 顯示提交至指定佇列之工作的相關資訊。
- -S start_time,end_time
- 顯示在指定時間間隔期間提交之工作的相關資訊。 以格式指定時間yyyy/mm/dd/HH:MM. 不要在時間間隔字串中指定空格。
必須與 -a 選項搭配使用,因為它只會尋找執行中工作的結果。
如需時間語法的相關資訊,請參閱 時間間隔格式。
- -T start_time,end_time
- 與 -t 選項一起使用。
顯示指定時間間隔內工作事件的相關資訊。 以格式指定時間yyyy/mm/dd/HH:MM. 不要在時間間隔字串中指定空格。
如需時間語法的相關資訊,請參閱 時間間隔格式。
- -u user_name | -u all
- 如果指定關鍵字 all ,則顯示由指定使用者或所有使用者提交之工作的相關資訊。 若要指定 Windows 使用者帳戶,請以大寫字母指定網域名稱,並在 Windows 指令中使用單一反斜線 (DOMAIN_NAME\user_name) ,或在 UNIX 指令中使用雙反斜線 (DOMAIN_NAME\\user_name)。
- job_ID | "job_ID[index]" ...
- 搜尋所有事件日誌檔,並僅顯示指定工作的相關資訊。 如果您指定工作陣列,則會依時間順序顯示所有元素。
當您確切知道想要哪些工作時,請指定工作 ID ,因此不要指定任何其他選項來控制工作選擇 (-a , -d , -e , -p , -r , -s , -D , -S , -T , -app , -G , -J , -Jd , -Lp , -M , -q , -u)。 如果您指定非邏輯的選取準則組合,則系統不會傳回任何相符工作。
在 LSF 多叢集功能 工作轉遞模式中,您可以使用本端工作 ID 及叢集名稱,從遠端叢集擷取工作詳細資料。 請使用下列查詢語法:bhist submission_job_id@submission_cluster_name若為工作陣列,請使用下列查詢語法:bhist "submission_job_id[index]"@submission_cluster_name使用 src_job_id@src_cluster_name 而非 bhist -l job_id 的優點是您可以使用 src_job_id@src_cluster_name 作為別名來查詢執行叢集中的本端工作,而不需要知道執行叢集中的本端工作 ID。 不論您使用哪個工作 ID (本端工作 ID 或 src_job_id@src_cluster_name) , bhist 指令輸出都相同。
您可以使用 bhist 0 選項來尋找本端叢集裡的所有歷程工作,但不支援 bhist 0@submission_cluster_name 選項。
- -h
- 將指令用法列印至 stderr 並結束。
- -V
- 將發行版本列印至 stderr 並結束。
輸出: 預設格式
- 記憶體用量
- 顯示尖峰記憶體用量及平均記憶體用量。
MEMORY USAGE: MAX MEM: 11 Mbytes; AVG MEM:6 Mbytes; MEM Efficiency: 100%如果耗用的記憶體大於或小於現行
rusage數量,則您可以相應地在下次提交相同工作時調整rusage值。 - CPU 使用率
- 顯示 CPU 效率及 CPU 尖峰使用情形。
CPU USAGE: CPU EFFICIENCY: 98%; CPU PEAK USAGE: 2從 Fix Pack 14 開始, 顯示執行工作時使用的 CPU 數目上限 (CPU 尖峰)、CPU 到尖峰的持續時間 (以秒為單位)、CPU 平均效率及 CPU 尖峰效率。 例如:
其中:CPU USAGE: CPU PEAK: 4.24; CPU PEAK DURATION: 54 second(s) CPU AVERAGEG EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%CPU PEAK是用於執行工作的 CPU 數目上限。CPU PEAK DURATION是達到工作 CPU 尖峰的持續時間 (以秒為單位)。CPU AVERAGE EFFICIENCY是使用下列公式來計算:CPU AVERAGE EFFICIENCY = (CPU_TIME / (JOB_RUN_TIME * CPU_REQUESTED)) * 100%每次在工作執行期間達到
CPU_PEAK_SAMPLE_DURATION值 (在 lsb.params 檔案中定義) 時,都會定期計算CPU AVERAGE EFFICIENCY。CPU_TIME和JOB_RUN_TIME值僅在前次計算之後使用; 工作的CPU AVERAGE EFFICIENCY值是每個週期中所有計算的CPU AVERAGE EFFICIENCY值的平均值。CPU PEAK EFFICIENCY是使用下列公式來計算:CPU PEAK Efficiency = (CPU PEAK / CPU_REQUESTED) * 100%
- 時間摘要
- 工作在各種狀態下所花費時間量的統計資料。
- PEND
- 在分派工作之前排除使用者暫停時間的等待時間總計。
- PSUSP
- 擱置工作的使用者暫停時間總計。
- 執行
- 工作的執行時間總計。
- USUSP
- 分派工作之後的使用者暫停時間總計。
- SUSP
- 分派工作之後的系統暫停時間總計。
- UNKWN
- 工作的不明時間總計 (如果執行主機上的 sbatchd 常駐程式暫時無法存取,則工作狀態會變成不明)。
- 總計
- 工作在所有狀態下所花費的時間總計。 對於已完成的工作,它是轉向時間,這是從工作提交到工作完成的時間間隔。
輸出: 長格式 (-l)
The-l選項會顯示含有下列額外欄位的長格式清單:
- 專案
- 從中提交工作的專案。
- 應用程式設定檔
- 向其提交工作的應用程式設定檔。
- 指令
- 工作指令。
詳細歷程包括工作群組修改、轉遞工作的日期及時間,以及轉遞工作的目標叢集名稱。
顯示的工作指令最多可以包含 4094 個字元 (若為 UNIX) ,或最多 255 個字元 (若為 Windows)。
- 起始檢查點期間
- 在工作層次使用 bsub -k 選項指定的起始檢查點期間,或在 lsb.applications 檔案中使用 CHKPNT_INITPERIOD 參數指定的應用程式設定檔中指定的起始檢查點期間。
- 檢查點期間
- 在工作層次使用 bsub -k 選項指定的檢查點期間,在 lsb.queues 檔案中具有 CHKPNT 參數的佇列中,或在 lsb.applications 檔案中具有 CHKPNT_PERIOD 參數的應用程式設定檔中。
- 檢查點目錄
- 在工作層次使用 bsub -k 選項指定的檢查點目錄,在 lsb.queues 檔案中具有 CHKPNT 參數的佇列中,或在 lsb.applications 檔案中具有 CHKPNT_DIR 參數的應用程式設定檔中。
- 移轉臨界值
- 在工作層次使用 bsub -mig 選項指定的移轉臨界值。
- 所要求的資源
- 顯示您在 bsub 指令中指定的所有資源需求字串。
- 執行 CWD
- 工作執行時所使用的實際現行工作目錄 (CWD)。
- 主機檔
- 提交或修改工作時所使用使用者指定主機檔的路徑。
- 執行 Rusage
- 如果結合的 RES_REQ 具有rusageOR | | 建構。 選擇的替代方案在這裡表示。
- 有效 RES_REQ
- 在解析任何 OR 建構之後,顯示排程器所看到的工作資源需求。
- 可調整大小的工作資訊
- 長達JOB_NEW事件, bhist 指令會在提交行中顯示可自動調整大小的屬性及調整大小通知指令。
- 長達JOB_MODIFY2來自 bmod 指令的事件, bhist 指令會在提交行中顯示可自動調整大小的屬性及調整大小通知指令。
- bmod -arn
jobID
Parameters of Job are changed: Autoresizable attribute is removed; - bmod -ar
jobID
Parameters of Job are changed: Job changes to autoresizable; - bmod -rnc
resize_notification_cmd
jobID
Parameters of Job are changed: Resize notification command changes to: <resize_notification_cmd>;h - bmod -rncn
jobID
Parameters of Job are changed: Resize notification command is removed;
- bmod -arn
jobID
- for theJOB_RESIZE_NOTIFY_START事件, bhist 指令會顯示下列訊息:
Added <num_tasks> tasks on host <host_list>, <num_slots> additional slots allocated on <host_list> - for theJOB_RESIZE_NOTIFY_ACCEPT事件, bhist 指令會顯示下列訊息:
- 如果已配置通知指令,且 sbatchd 常駐程式已順利起始設定通知指令,則 bhist 指令會顯示下列訊息:
Resize notification accepted. Notification command initialized (Command PID: 123456) - 如果未定義通知指令, bhist 會顯示下列訊息:
Resize notification accepted - 如果 sbatchd 常駐程式因任何原因而報告失敗, bhist 會顯示下列訊息:
Resize notification failed
- 如果已配置通知指令,且 sbatchd 常駐程式已順利起始設定通知指令,則 bhist 指令會顯示下列訊息:
- for theJOB_RESIZE_NOTIFY_DONE事件, bhist 指令會顯示下列訊息:
- 如果狀態為 0 ,Resize notification command completed
- 如果狀態為 1 ,Resize notification command failed
- 長達JOB_RESIZE_RELEASE事件, bhist 指令會顯示下列資訊:
Release allocation on <num_hosts> Hosts/Processors <host_list> by user or administrator <user_name> Resize notification accepted;對於 bmod -rncn 選項, bhist 指令會顯示下列訊息:Resize notification command disabled - 長達JOB_RESIZE_CANCEL事件, bhist 指令會顯示下列訊息:
Cancel pending allocation request
- 同步執行
- 已使用 -K 選項提交工作。 LSF 會提交工作,並等待工作完成。
- 終止的工作: 結束原因
- 對於已終止的工作,顯示結束原因。
- 互動式工作
- 對於互動式工作, bhist -l 指令不會顯示執行起始目錄、現行工作目錄或工作執行 PID 的相關資訊。
- Dispatched <number> Task(s) on Host(s)
- 工作中的作業數目,以及那些作業傳送至其中以進行處理的主機。 如果在 lsf.conf 檔案中設定 LSB_ENABLE_HPC_ALLOCATION=Y 參數,則會顯示。
- Assigned resource <資源___主機名稱> with names <名稱>
- 從 Fix Pack 14 開始,指派給資源的 名稱會隨工作分派。 資訊將位於此格式的工作標頭中。 例如,Assigned resource <fpga___hostname> with names <card1 card2 card3>
- Allocated <number> Slot(s) on Host(s)
- 已根據作業數配置給工作的介面槽數,以及配置介面槽的主機數。 如果在 lsf.conf 檔案中設定 LSB_ENABLE_HPC_ALLOCATION=Y 參數,則會顯示。
- 所要求的網路及 PE 網路 ID
- 使用 bsub-network 選項提交之 IBM Parallel Edition (PE) 工作的網路資源需求,或者在佇列 (定義於 lsb.queues 檔案中) 或應用程式設定檔 (定義於 lsb.applications 檔案中) 中指定 NETWORK_REQ 參數時。
bhist -l 749 Job <749>, User <user1>;, Project <default>, Command <my_pe_job> Mon Jun 4 04:36:12: Submitted from host <hostB>, to Queue < priority>, CWD <$HOME>, 2 Tasks, Requested Network <type=sn_all:protocol=mpi:mode=US:usage= shared:instance=1>; Mon Jun 4 04:36:15: Dispatched 2 Task(s) on Host(s) <hostB>, Allocated <1> Slot(s) on Host(s) <hostB>; Effective RES_REQ <select[type == local] rusage [nt1=1.00] >, PE Network ID <1111111> <2222222> used <1> window(s)per network per task; Mon Jun 4 04:36:17: Starting (Pid 21006); - 資料需求
- -l -data 選項會針對具有資料需求及任何資料需求修改的工作,顯示所要求檔案或標籤的清單。
輸出: 親緣性資源需求資訊 (-l -aff)
- HOST
- 作業執行所在的主機。
- 類型
- CPU 連結所要求的處理器裝置類型。 下列的其中之一:numa,socket,core,或thread.
- LEVEL
- CPU 連結所要求的處理器裝置連結層次。 下列的其中之一:numa,socket,core,或thread. 如果未要求 CPU 連結層次,則會有橫線 (-) 會顯示。
- 專用
- 專用 CPU 連結所要求的處理器裝置連結層次。 下列的其中之一:numa,socket,或core. 如果未要求專用連結層次,則會有橫線 (-) 會顯示。
- IDS
- 作業之 CPU 配置的實體或邏輯 ID 清單。
此清單由一組路徑組成,以一連串以斜線字元區隔的整數來表示 (/) ,透過主機的拓蹼樹狀結構。 每一個路徑都會識別配置給作業的唯一處理裝置。 例如,格式為3/0/5/12代表對 NUMA 節點 3 中 Socket 0 核心 5 中執行緒 12 的配置。 格式的字串2/1/4代表對 NUMA 節點 2 中 Socket 1 的核心 4 的配置。 整數對應於拓蹼樹狀結構中從 bhosts -aff 指令顯示的節點 ID 號碼。
- POL
- 所要求的記憶體連結原則。 兩者擇一local或pref. 如果未要求記憶體連結,則會有橫線 (-) 會顯示。
- NUMA
- 作業記憶體所連結之 NUMA 節點的 ID。 如果未要求記憶體連結,則會有橫線 (-) 會顯示。
- 大小
- 在 NUMA 節點上配置給作業的記憶體數量。
bsub -n 6 -R"span[hosts=1] rusage[mem=100]affinity[core(1,same=socket,
exclusive=(socket,injob)):cpubind=socket:membind=localonly:distribute=pack]" myjob
Job <6> is submitted to default queue <normal>.
bhist -l -aff 6
Job <6>, User <user1>, Project <default>, Command <myjob>
Thu Feb 14 14:13:46: Submitted from host <hostA>, to Queue <normal>, CWD <$HO
ME>, 6 Task(s), Requested Resources <span[hos
ts=1] rusage[mem=100]affinity[core(1,same=socket,exclusive
=(socket,injob)):cpubind=socket:membind=localonly:distribu
te=pack]>;
Thu Feb 14 14:15:07: Dispatched 6 Task(s) on Host(s) <hostA> <hostA> <hostA>
<hostA> <hostA> <hostA>; Allocated <6> Slot(s) on Host(s)
<hostA> <hostA> <hostA> <hostA> <hostA> <hostA>;
Effective RES_REQ <select[type == local] order[r15s:pg]
rusage[mem=100.00] span[hosts=1] affinity [core(1,same=
socket,exclusive=(socket,injob))*1:cpubind=socket:membind=
localonly:distribute=pack] >;
AFFINITY:
CPU BINDING MEMORY BINDING
------------------------ --------------------
HOST TYPE LEVEL EXCL IDS POL NUMA SIZE
hostA core socket socket /0/0/0 local 0 16.7MB
hostA core socket socket /0/1/0 local 0 16.7MB
hostA core socket socket /0/2/0 local 0 16.7MB
hostA core socket socket /0/3/0 local 0 16.7MB
hostA core socket socket /0/4/0 local 0 16.7MB
hostA core socket socket /0/5/0 local 0 16.7MB
Thu Feb 14 14:15:07: Starting (Pid 3630709);
Thu Feb 14 14:15:07: Running with execution home </home/jsmith>, Execution CWD
</home/jsmith>, Execution Pid <3630709>;
Thu Feb 14 14:16:47: Done successfully. The CPU time used is 0.0 seconds;
Thu Feb 14 14:16:47: Post job process done successfully;
MEMORY USAGE:
MAX MEM: 2 Mbytes; AVG MEM: 2 Mbytes; MEM EFFICIENCY: 100%
CPU USAGE:
CPU PEAK: 4.24 ; CPU PEAK DURATION: 54 second(s)
CPU AVERAGE EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%
Summary of time in seconds spent in various states by Thu Feb 14 14:16:47
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
81 0 100 0 0 0 181
輸出: 資料需求資訊 (-l -data)
bhist -data -l 84046
Job <84046>, User <user1>, Project <default>, Command <bstage out -src /home/
user1/data2; bstage out -src /home/user1/data2 -dst /tmp;
datajob1.sh>
Mon Aug 18 15:06:57: Submitted from host <hostA>, to Queue <normal>, CWD </sc
ratch/user1/workspace/simulation/data/>, Data Require
ment Requested;
DATA REQUIREMENTS:
FILE: hostA:/home/user1/data2
SIZE: 40 MB
MODIFIED: Thu Aug 14 17:01:57
FILE: hostA:/home/user1/data3
SIZE: 45 MB
MODIFIED: Fri Aug 15 16:32:45
Mon Aug 18 15:07:07: Dispatched to <hostB>, Effective RES_REQ <select[type ==
local] order[r15s:pg] >;
Mon Aug 18 15:07:07: Starting (Pid 16128);
Mon Aug 18 15:07:07: Running with execution home </home/user1>, Execution CWD <
/scratch/user1/workspace/simulation/data/>, Execution
Pid <16128>;
Mon Aug 18 15:08:47: Done successfully. The CPU time used is 0.4 seconds;
Mon Aug 18 15:08:47: Post job process done successfully;
MEMORY USAGE:
MAX MEM: 3 Mbytes; AVG MEM: 2 Mbytes; MEM EFFICIENCY: 100%
CPU USAGE:
CPU PEAK: 4.24 ; CPU PEAK DURATION: 54 second(s)
CPU AVERAGE EFFICIENCY: 99.55%; CPU PEAK EFFICIENCY: 106.02%
Summary of time in seconds spent in various states by Mon Aug 18 15:08:47
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
10 0 100 0 0 0 110
輸出: 使用者指定的主機檔 (-l -hostfile)
bhist -l -hostfile 1976
Job <1976>, User <user1>, Project <default>, Command <my_data_job>
Fri Sep 20 16:31:17: Submitted from host <hostA>, to
Queue <normal>, CWD <$HOME/source/user1/work>,
Host file </home/user4/myhostfile>;
Summary of time in seconds spent in various states by Wed Sep 25 10:50:37
PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
21305 0 0 0 0 0 21305
USER-SPECIFIED HOST FILE:
HOST SLOTS
host01 3
host02 1
host01 1
host02 2
host03 1
檔案
讀取lsb.events檔案中。
另請參閱
lsb.events 檔案、 bgadd、 bgdel、 bjgroup、 bsub、 bjobs、 lsinfo 指令
時間間隔格式
您可以使用時間間隔來定義開始及結束時間,以收集要擷取及顯示的資料。 雖然您可以同時指定開始和結束時間,但也可以讓其中一個值成為預設值。 您可以透過指定日期或時間,將其中一個時間指定為絕對時間,也可以指定相對於現行時間的時間。
指定時間間隔:
start_time,end_time|start_time,|,end_time|start_time
以下列格式指定 start_time 或 end_time :
[year/][month/][day][/hour:minute|/hour:]|.|.-relative_int
- 年
- 代表行事曆年份的四位數數字。
- 單月
- 數字 1-12 ,其中 1 是 1 月, 12 是 12 月。
- 日
- 數字 1-31 ,代表月份日期。
- 小時
- 整數 0-23 ,代表 24 小時制的當日小時。
- 分鐘
- 整數 0-59 ,代表分鐘。
- . (句點)
- 代表現行month/day/hour:minute.
- .-relative_int
- 數字 1-31 ,指定現在之前的相對開始或結束時間。
- start_time、end_time
- 指定間隔的開始和結束時間。
- start_time ,
- 指定開始時間,並讓結束時間預設為現在。
- , end_time
- 指定從第一個記載的出現項目開始,並在指定的時間結束。
- start_time
- 開始於指定的最特定時段的開頭,結束於指定時段的最大值。 例如,2/指定 2 月的月份-從 2 月 1 日凌晨 00:00 開始,並在 2 月的最後可能分鐘 (2 月 28 日午夜) 結束。
絕對時間範例
假設現行時間為May 9 17:06 2008:
1,8 =May 1 00:00 2008收件者May 8 23:59 2008
,4 = 第一次出現的時間May 4 23:59 2008
6 =May 6 00:00 2008收件者May 6 23:59 2008
2/ =Feb 1 00:00 2008收件者Feb 28 23:59 2008
/12: =May 9 12:00 2008收件者May 9 12:59 2008
2/1 =Feb 1 00:00 2008收件者Feb 1 23:59 2008
2/1, =Feb 1 00:00至現行時間
,. = 第一次出現到現行時間的時間
,2/10: = 第一次出現的時間May 2 10:59 2008
2001/12/31,2008/5/1 = 來源Dec 31 2001 00:00:00收件者May 1 2008 23:59:59
相對時間範例
.-9, =April 30 17:06 2008至現行時間
,.-2/ = 第一次出現的時間Mar 7 17:06 2008
.-9,.-2 = 九天前至兩天前 (April 30 17:06 2008收件者May 7 17:06 2008)