附錄 2


網管的工作日誌範本

工作日誌對網路管理員來說,是非常重要的文件。任何一位有良好習慣的管理員,每天例行工事之一就是要整理網管日誌。

哦﹐很久沒做 report 和 log 了﹐下面是小弟剛到某公司第二周的‘工作報告’和‘事件彙報’﹐或許可以給您參考一下﹕

~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * 


本周主要工作和進度﹕

1﹐繼續對公司網路結果探測﹐已經延伸至 3 樓。初步完成。
2﹐修改 12 樓之物理網路圖。已完成第一版。(請參考附件 1﹐kh_phy.vsd)
3﹐繪製 12 樓之邏輯網路圖。已完成初稿。(請參考附件 2﹐kh_logi.vsd)
4﹐繼續修改《PC Information Sheet》﹐並以此為基礎設計出《Server Information
Sheet》。基本完成。(請參考附件 3﹐KH Server
Information Sheet.doc)
5﹐對 miao 和 whale 兩台伺服器進行設定檔記錄。初步完成。(請參考附件
4﹐ks_conf.doc)
6﹐草擬公司《網路安全原則》。部份完成。(請參考附件 5﹐net_policy.doc)
7﹐草擬《網路使用者指南》。僅開頭﹐須等《網路安全原則》完成始能繼續。
8﹐常務事件處理及技術支援。基本上得以解決。(請參考附帶文件 6﹐events_wk02.txt)


----------------------------
原計劃中沒有實行之事務和原因﹕

1﹐對所有 PC 進行資料記錄。
從(某某上司)處得知目前 PC 部份無需管理﹐所以目前僅就 miao 和 whale 主機進行了記
錄。

2﹐如有可能﹐會對目前使用者帳戶做一些整理。
目前看來似乎沒有此必要性﹐待空閑時再考慮處理。


--------
下周計劃﹕

1﹐主攻《網路安全原則》的草擬。
2﹐繼續草擬《網路使用者指南》。
3﹐修改 3 樓之網路圖﹐包括物理和邏輯的。
4﹐繪製高雄總部的網路邏輯圖。
5﹐完成伺服器的設定檔記錄。
6﹐如有可能﹐會對目前使用者帳戶做一些整理。

----
建議﹕
1)
首先多謝(某某上司)這星期來的指點和照顧。讓弟得以順利展開工作﹐並同時增進了對公司
人事、及網路情況的了解。

2)
請抽空審查 12 樓網路之物理和邏輯兩圖﹐請糾正任何不實之處。(必要時﹐可以對原文件
進行修改。它們都是用 Visio Pro 5
繪製的﹐如果您用的版本較新﹐修改後請注意版本兼容情況。)

3)
請抽空審閱“ Server Information Sheet ”﹐對不必要之項目、或需增加項目加以指示。

4)
伺服器設定檔案記錄主要是目前機器上面的檔案的拷貝、和某些命令的執行結果。或許尚有
未包括的文件。如果發現有任何錯誤﹐或建議﹐請儘早指示。但考慮到該文件的長度﹐回覆
可以暫緩。

5)
請檢查“events_wk02.txt”(附帶文件5)中關於伺服器的修改﹐如果發現有錯誤的步驟或錯
誤的更改﹐請給予修正指示。尤其是
2000/06/09 事件 2 中關於 DHCP 的建議﹐請考慮一下。

6)
請仔細審閱《網路安全原則》一文﹐如果發現有任何需要改進的地方﹐一定要提出﹐好及早
糾正。假如您覺得文章方向有偏頗﹐請提出指示。該文件目前僅為草稿﹐在定稿之前﹐一定
要呈交總經理或相關行政領導人審查﹐並獲得通過方可發行。如有可能﹐還要咨詢公司之法
律顧問。

7)
根據目前所草擬之《網路安全原則》﹐除了《網路使用者指南》外﹐我們尚需要《網路服務
管理規程》。它的內容應該包括﹕
7.1網路運作之服務標準(即何種服務可以運行﹐以及運行的服務等級﹔何種服務需要禁止﹐
以及禁止等級)
7.2伺服器之架設標準(例如硬體要求、軟體要求、平臺、版本、授權證書範圍、指定或非指
定機器、等等)
7.3伺服器服務的安裝步驟(最好為 step by step
的安裝﹐除了可以讓相關人員在事故重建中得到標準外﹐對任何接手人員都可立即上軌)
7.4網路的稽查原則(包括記錄檔的配置和存放、人員的指定、排程、等等)
7.5網路備份原則(硬體設備、安裝、服務範圍、人員、排程、等等)。另﹐在《網路安全原
則》中有提及到網路使用者的備份服務﹐是否必要﹖和哪些人員需要﹖
7.6網路監控和警備原則(設備、手段、要求程度、人員、預警臨界界定、上報渠道、等等)
由於弟對公司網路架構不熟﹐而且說老實﹐也未能勝任技術要求﹐尤其是伺服器、路由設備
和網路監測等方面。所以﹐以上第 7 點的內容我想最後還是請您撰寫。

8)
根據目前所草擬之《網路安全原則》﹐我們會對遠端訪問服務加以限制。但弟不是很清楚公
司目前或將來會否提供遠端訪問。以及它的安全要求是什麼﹖請作出指引。

9)
根據目前所草擬之《網路安全原則》﹐公司也會監管網際網路的訪問﹐其中會包括站台過濾
和 anit-spam
機製。不知道是否可行﹖如果有此需要﹐其設定指南也應該包括在《網路服務管理指南》
中。

10)
根據目前所草擬之《網路安全原則》﹐公司會要求所有工作站安裝放病毒軟體﹐不知道公司
對此的規定如何﹖

11)
基於前述﹐弟對許多規定還相當模糊﹐目前在《網路安全原則》所提議的﹐大部份為“杜
撰”﹐實在不知道其必要性和可行性。如果您覺得有探討的餘地﹐請給予指示。


~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ *

下面為當周日誌﹕

~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ *


----------
2000/06/09


1)10:30am

問題﹕
根據文彬之報告﹐他的主機不能用 smtp.xxx.com 主機寄信給非本公司的地址﹐同樣用
smtp.ks.xxx.com 主機也不能。均遇到 "not relaying" 的問題。

測試步驟﹕
1﹐到文彬的電腦輸入 hostname 得到其主機名稱為﹕conquer.xxx.com﹐ ifconfig |grep
addr 得到它的 IP 為 192.168.20.128
2﹐檢查文彬的郵件軟體(netscape, linux version)之sender address 為
conquer@xxx.com﹐將之加進 "reply to" 也同樣遇到相同問題
3﹐telnet 至 smtp.ks.xxx.com (211.xx.xx.76)﹐查看 /var/log/maillog 發現關於
conquer 這個 sender 有這樣的敘述﹕"relay=IDENT:conquer@[192.168.20.128]"

推測﹕
看情形似乎是 sendmail 不能夠反查詢文彬的主機。
在 sendmail 8.9.x 已經不開放任意 relay 的情形下﹐sendmail 要接收一封轉寄郵件的時
候﹐必須反查詢 sender 的主機地址。這動作可以經由 hosts 檔或 DNS。

修正步驟﹕
1﹐cat /etc/host.conf 確定其order是 hosts,bind
2﹐cat /etc/hosts | grep 192.168.20 並沒有發現任何記錄
3﹐nslookup 查詢 conquer.xxx.com 並沒有結果﹐set q=ptr 後查詢 192.168.20.128 也
沒結果。
4﹐至此應該確定是反查詢的問題了。解決方法有三﹕
4.1 為192.168.20 建立反解 DNS﹐同時更新 xxx.com 的正解以將 R/D 的主機加進去。但
考慮到 DNS
的對外開放性。在這台允許直接外部連線之 DNS 主機上透露過多內的部網路資訊﹐實在是
非常不明智的行為,不應該考慮﹐除非在內部網路建立獨立的 DNS 主機。但這樣牽涉到目
前的網路架構問題。相信目前是難以實現的﹐就算必須這樣做﹐也應該向上頭申請獲批准方
可實行。
4.2 將文彬電腦用 hosts 靜態對應。但這樣做的話﹐其他在 192.168.20 下面的主機也要
這樣做﹐實在太麻煩了。
4.3 修改 /etc/mail/access 檔﹐將文彬主機的 IP 加入。但和前一個理由一樣﹐這樣做必
須為每一台主機建立
RELAY﹐有點麻煩。倒不如將整個 192.168.20 網加入﹐不過考慮到其他的本地網路﹐或許
他們將來也會用到本機器做 mail relay
﹐所以決定將整組 192.168 加入。雖然範圍過大了﹐不過“相信”這個 reserved private
IP 網路應該不至於讓目前 server 成為 ineternet 上面的 spam 基地吧。
5﹐最後 su 為 root ﹐修改 /etc/mail/access ﹐將 "192.168 RELAY" 加入
6﹐重新啟動 sendmail ﹕ /etc/rc.d/init.d/sendmail restart﹐確定有兩個 'OK'

結果﹕
對外郵件傳送成功。


2) 11:10am

問題﹕
接到(某某上司)來電﹐得知 Jenifer 之電腦無法使用郵件。

檢測步驟﹕
1﹐嘗試下載郵件﹐或得 " can not connect to server" 的回應
2﹐在 command prompt 輸入 'winipcfg' 竟然沒有此命令﹐原來這是 windows 2000 的機
器﹐改為輸入 ipconfig /all
。發現這台主機竟然使用從一台 IP 為 192.168.23.48 的DHCP server 分配下來的
IP﹕192.168.23.101 ﹐而它目前並沒有獲得 DNS 的設定。
3﹐輸入 ipconfig release 後接 ipconfig renew ﹐IP 並沒有改變。

推測﹕
可能在同一物理網路上有其他主角正扮演著 DHCP 角色﹐這應該和目前的網路設計有所出
入。更糟糕的是﹕這台 DHCP server 並沒有為 clients 指定 DNS 內容﹐這恐怕是連不上
 mail server 的主要原因。跟著接到(某某上司)來電﹐和他討論的結果基本上和上面推測
一致。他建議查詢一下 R/D 部門是否有哪一台電腦不小心啟動了 DHCP 服務。

修正步驟﹕
1﹐出來剛好碰到豐榮﹐在問他的時候﹐旁邊的志全則回答說﹕那台 DHCP 已經關閉了。經
檢查發現是 CIH 的機器。
2﹐然後回到 Jenifer 的機器﹐重新執行 ipconfig /releas 和 ipconfig /renew 就成功
抓回 192.168.16.x 之 IP ﹐且 DNS 也指定為正確的 211.72.41.76

結果﹕
郵件收發恢復正常。

附註﹕
1﹐在同一時間內﹐分別收到 3 樓和惠珍的報告﹐經檢測發現都是同一 DHCP 原因引起。在
Windows 98 上面﹐輸入 winipcfg 再用“全部更新”將之修改過來就沒問題了。
2﹐經檢查目前 192.168.16.254 這台 DHCP server 之 /etc/dhcpd.conf 檔﹐發現﹕
default-lease-time 3600;
max-lease-time 7200;
似乎短了些。這樣除了會做成過多的不必要 dhcp 廣播封包和續約封包外﹐也容易讓做出
clients
租約容易過期。其時如果有人不小心啟動了另外一台 DHCP 的話﹐在 client 重新發放
dhcpcover 的時候﹐
會很容易出現今早的問題。有鑒於此﹐我將 /etc/dhcpd.conf 設定改為﹕
default-lease-time 259200;
max-lease-time 777600;
分別是 3 天和 5 天。相信這會比較合理些。並重新啟動 dhcp ﹕
'/etc/rc.d/init.d/dhcpd restart'

建議﹕
經此一事件後﹐我覺得 R/D 和 I/A 部門的網路和辦公室網路﹐至少要在物理連接上面應該
分開。我們可以在 gateway 上面多加一張網路卡﹐然後用獨立的 switch / hub 來連接
R/D
、I/A、或是辦公室網路。這樣在安全上面﹐或是在網路之穩定性﹐都會有所保證。
又或者將他們的測試網路獨立出來﹐用火牆將所有危險封包攔下來。
不過﹐要更改目前的網路設計﹐一定要向上面申請﹐必要時還要上面來設計。這個等下週報
告再提吧。



-----------
2000/06/14

1) 08:15am
問題﹕
內部網路不能連線之外面 internet 。

檢測步驟﹕
1﹐嘗試 ping 外邊網路﹐如 www.hinet.net ﹐可以 resolve 到 IP﹐但 ping 沒反應。
2﹐嘗試 ping smtp.xxx.com 竟然連 IP 也 resolve 不到。
3﹐telnet 至 miao (gw)﹐重複上兩步驟﹐結果一樣。
4﹐執行 traceroute 168.95.1.1 (hinet DNS)﹐得到結果如下﹕
traceroute to 168.95.1.1 (168.95.1.1), 30 hops max, 38 byte packets
1 211.72.41.73 (211.72.41.73) 0.869 ms 0.821 ms 0.740 ms
2 * * *
3 * * *
4 * * *
[aborted]

5﹐發一封郵件至 @xxx.com ﹐只能用 kh 的 smtp ﹐但使用 smtp.xxx.com 則不行。
6﹐執行 nslookup ﹐發現只能查詢 cache 中的記錄。其餘的一概不通﹐連 smtp.xxx.com
也查詢不到。

推測﹕
可能是 router 的問題。

修正步驟﹕
1﹐馬上用 email 通知(某某上司)﹐等他上班後再致電他。
2﹐沒聯絡上(某某上司)﹐卻找到(另一上司)﹐他建議找 hinet 報修。但由於不知道 ADSL
的號碼﹐幾經週折最後找到成章﹐原來號碼是 55xxx26。
3﹐撥112找中華電信報修﹐等待回話。
4﹐10:40am 接到中華電信來電﹐說網路已經修復。

結果﹕
網路恢復正常。


-----------
2000/06/15

1)09:50am

問題﹕
再次接到三樓投訴關於 DHCP 的問題。情形和上次一樣。

推測﹕
可能又是 CIH 的機器之 DHCPD 又跑起來了。

修正﹕
1﹐直接找 CIH 查詢﹐但他不在。
2﹐因為機器的 console 處於開啟狀態﹐所以輸入 ps ax | grep dhcp 發現果然在跑。
3﹐用 kill 將之殺掉了。

結果﹕
回復三樓映善 dhcpd 已經關閉﹐請他重試。未能實質性確定問題之解決﹐相信沒有進一步
的投訴應該沒問題了。

備註﹕
因為該事件已經發生第二次了﹐我認為有必要以非口頭形式警告錯誤啟動網路服務以致干擾
正常網路行為的當事人。
查證該服務是在 CIH 之機器被執行的﹐雖然沒有直接證據顯示是 CIH 本人之故意行為﹐但
還是有必要給 CIH 一封 email 陳述原因﹐以防類似事件重演。 email 內容如下﹕
---------------------------------------------
FROM﹕ Kenny Chen﹐ 網路事業部
TO﹕CIH﹐ 硬體事業部
Subject: DHCP service

Hi CIH 兄您好﹕

今天早上 09:50am 接到高雄總公司 3 樓陳映善兄的電話報告﹕他們有些 DHCP 客戶主機再
次被 192.168.23.48 這台主機錯誤分配到 192.168.23.x 的 IP 去了。

經查證 192.168.23.48 這台主機是您目前使用的機器。因為當時您未在場﹐所以弟私自將
hdcpd 的服務關閉了。僅此知會。

由於相同事件已經於一個星期內第二次發生﹐且干擾了公司目前網路的正常運作。茲請求您
控制好貴主機﹐以免錯誤啟動可能影響公司正常網路的任何網路服務。

如果您已經將相關服務關閉(包括從開機程序或其他自動啟動服務中移除)﹐並確定將來不會
再次發生影響公司網路的事件﹐您可能忽略以上請求。假如您需要我們的協助﹐可以直接與
本人聯係。

讓我們為維護一個安全高效的公司網路環境共同努力﹗

祝﹕工作愉快﹗

Regards,
Kenny
網路事業部
---------------------------------------------


2) 10:55am
問題﹕
接到硬體事業部那邊關於 Windows 列印的問題報告。

檢測﹕
情形和之前的狀況一樣

修正﹕
按 2000/06/02 事件1之解決方法修正。

結果﹕
列印正常



~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * 

 

 


www.study-area.org © 2001 Netman 網中人
Last Updated: December 12, 2002