一、.邻居形成阶段的hello参数不匹配故障
- 不匹配的HELL0间隔,默认10秒,通过debug ip ospf adj可以快速隔离故障
- 不匹配的区域ID,通过debug ip ospf adj可以快速隔离故障
- 不匹配的验证方法、验证的KEY值,通过debug ip ospf adj可以快速隔离故障
- 不匹配的末节区域特性(STUB ,NSSA等),通过debug ip ospf adj可以快速隔离故障
二、从DOWN状态到FULL状态变化过程中的状态故障,可以用show ip ospf neighbor、debug ip ospf adj隔离故障
- 陷入init状态,这是一个发起状态,如果始终不能从这个状态出来表示双方不能就HELLO交换达成一致,或者HELLO总是单向发送,引发这类问题的原因可能是:
- ACL阻拦了HELLO的通信
- 中途链路有问题,阻隔了HELLO通信
- 双方验证不一致
- FR网络中映射没有容许Broadcast参数
- 陷入ATTEMPT状态,这个主要针对NBMA网络,双方邻居关系起不来,发送了HELLO,但是没办法接收到回应(主要针对neighbor指定的邻居),考虑检查neighbor配置以及有无ACL等阻挡了HELLO的通信。
- 陷入2-way状态,如果总是不能从2-way状态出来,很少见这种问题,如果发生,看看是不是该选举DR/BDR却由于其他原因而未发生选举。
- 陷入exstart/exchange状态,这个状态主要是用来交换DBD,如果出不来,考虑
- MTU是否匹配
- 与邻居是否有重复的RID
- 链路2层问题
- 陷入LOADING状态,这个状态主要进行LSR的加载等。如果从这个状态出不来,考虑
- 是否有不匹配的MTU
- 错误的LSR
三、LSA类问题故障
- 点到点链路,一端采用ip unnumbered方式,这样会导致双方数据库不匹配,sh ip ospf database router隔离故障,看LINK DATA字段是否有无编址的索引号,不要使用无编址方式。
- ASBR产生5类LSA,在本区域是不会有4类LSA的,而一旦跨越了ABR,则ABR就需要产生一个4类LSA向外传播。
- OSPF获得一条5类LSA时,要检查对应的转发IP字段,这个转发IP必须是能通过区域内或区域间学习到的,否则不会装入这个外部路由到路由表。sh ip ospf ,sh ip ospf database exter隔离故障
- ospf的路由汇总是在进程级别,可以在ABR执行区域间汇总(area X range *****,通过sh ip ospf 可以看到汇总情况是否正常,如是否是ACTIVE状态),也可以是ASBR上的外部路由汇总(summary-address ,通过sh ip ospf summary-address看度量值是不是16777215这个错误值等)
四、邻居形成过程及每隔30分钟的LSA同步过程导致的CPUHOG问题,主要是通过看日志,以及调整packet pacing(邻居过程),调整组步调来每隔几分钟检查已经超过刷新时间的LSA条目,从而进行次数频繁但不会占用太多CPU周期的LSA同步。timer lsa-group pacing
五、NBMA网络下OSPF特性,主要考虑不同拓扑使用不同的OSPF网络
文章评论