當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

eureka 集群失败的原因_eureka集群中的疑问？

發布時間：2023/12/2 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 eureka 集群失败的原因_eureka集群中的疑问？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

題主的問題描述太繞了，我們先把集群中的角色定義下：

Eureka架構

比較細節的架構圖如下所示：

在配置多個EurekaServer的Service Provider，每次Service Provider啟動的時候會選擇一個Eureka Server，之后如果這個Eureka Server掛了，才會切換Eureka Server，在當前使用的Eureka Server掛掉之前，不會切換。

被Service Provider選擇用來發送請求Eureka Server其實比其他Server多了一項工作，就是發客戶端發來的請求，轉發到集群中其他的Eureka Server。其實這個壓力并沒有太大，但是如果集群中實例個數比較多，或者心跳間隔比較短的情況下，的確有不小的壓力。可以考慮每個服務配置的Eureka Server順序不一樣。

但是其實仔細想想，只是個請求轉發，能有多大壓力啊。。。。

最后，我們詳細分析下服務注冊與取消的源代碼(可以直接參考下我的博客關于Eureka的系列分析張哈希的博客 - CSDN博客?blog.csdn.net

)：

關于服務注冊開啟/關閉服務注冊配置：eureka.client.register-with-eureka = true (默認)

什么時候注冊？應用第一次啟動時，初始化EurekaClient時，應用狀態改變：從STARTING變為UP會觸發這個Listener，調用instanceInfoReplicator.onDemandUpdate(); 可以推測出，實例狀態改變時，也會通過注冊接口更新實例狀態信息

statusChangeListener = new ApplicationInfoManager.StatusChangeListener() {

@Override

public String getId() {

return "statusChangeListener";

}

@Override

public void notify(StatusChangeEvent statusChangeEvent) {

if (InstanceStatus.DOWN == statusChangeEvent.getStatus() ||

InstanceStatus.DOWN == statusChangeEvent.getPreviousStatus()) {

// log at warn level if DOWN was involved

logger.warn("Saw local status change event {}", statusChangeEvent);

} else {

logger.info("Saw local status change event {}", statusChangeEvent);

}

instanceInfoReplicator.onDemandUpdate();

}

};定時任務，如果InstanceInfo發生改變，也會通過注冊接口更新信息

public void run() {

try {

discoveryClient.refreshInstanceInfo();

//如果實例信息發生改變，則需要調用register更新InstanceInfo

Long dirtyTimestamp = instanceInfo.isDirtyWithTime();

if (dirtyTimestamp != null) {

discoveryClient.register();

instanceInfo.unsetIsDirty(dirtyTimestamp);

}

} catch (Throwable t) {

logger.warn("There was a problem with the instance info replicator", t);

} finally {

Future next = scheduler.schedule(this, replicationIntervalSeconds, TimeUnit.SECONDS);

scheduledPeriodicRef.set(next);

}

}在定時renew時，如果renew接口返回404(代表這個實例在EurekaServer上面找不到)，可能是之前注冊失敗或者注冊過期導致的。這時需要調用register重新注冊

boolean renew() {

EurekaHttpResponse httpResponse;

try {

httpResponse = eurekaTransport.registrationClient.sendHeartBeat(instanceInfo.getAppName(), instanceInfo.getId(), instanceInfo, null);

logger.debug("{} - Heartbeat status: {}", PREFIX + appPathIdentifier, httpResponse.getStatusCode());

//如果renew接口返回404(代表這個實例在EurekaServer上面找不到)，可能是之前注冊失敗或者注冊過期導致的

if (httpResponse.getStatusCode() == 404) {

REREGISTER_COUNTER.increment();

logger.info("{} - Re-registering apps/{}", PREFIX + appPathIdentifier, instanceInfo.getAppName());

long timestamp = instanceInfo.setIsDirtyWithTime();

boolean success = register();

if (success) {

instanceInfo.unsetIsDirty(timestamp);

}

return success;

}

return httpResponse.getStatusCode() == 200;

} catch (Throwable e) {

logger.error("{} - was unable to send heartbeat!", PREFIX + appPathIdentifier, e);

return false;

}

向Eureka發送注冊請求EurekaServer發生了什么？

主要有兩個存儲，一個是之前提到過的registry，還有一個最近變化隊列，后面我們會知道，這個最近變化隊列里面就是客戶端獲取增量實例信息的內容：

# 整體注冊信息緩存

private final ConcurrentHashMap>> registry = new ConcurrentHashMap>>();

# 最近變化隊列

private ConcurrentLinkedQueue recentlyChangedQueue = new ConcurrentLinkedQueue();

EurekaServer收到實例注冊主要分兩步：調用父類方法注冊

同步到其他EurekaServer實例

public void register(InstanceInfo info, boolean isReplication) {

int leaseDuration = 90;

if (info.getLeaseInfo() != null && info.getLeaseInfo().getDurationInSecs() > 0) {

leaseDuration = info.getLeaseInfo().getDurationInSecs();

}

//調用父類方法注冊

super.register(info, leaseDuration, isReplication);

//同步到其他EurekaServer實例

this.replicateToPeers(PeerAwareInstanceRegistryImpl.Action.Register, info.getAppName(), info.getId(), info, (InstanceStatus)null, isReplication);

}

我們先看同步到其他EurekaServer實例

其實就是，注冊到的EurekaServer再依次調用其他集群內的EurekaServer的Register方法將實例信息同步過去

private void replicateToPeers(Action action, String appName, String id,

InstanceInfo info /* optional */,

InstanceStatus newStatus /* optional */, boolean isReplication) {

Stopwatch tracer = action.getTimer().start();

try {

if (isReplication) {

numberOfReplicationsLastMin.increment();

}

// If it is a replication already, do not replicate again as this will create a poison replication

if (peerEurekaNodes == Collections.EMPTY_LIST || isReplication) {

return;

}

for (final PeerEurekaNode node : peerEurekaNodes.getPeerEurekaNodes()) {

// If the url represents this host, do not replicate to yourself.

if (peerEurekaNodes.isThisMyUrl(node.getServiceUrl())) {

continue;

}

replicateInstanceActionsToPeers(action, appName, id, info, newStatus, node);

}

} finally {

tracer.stop();

}

private void replicateInstanceActionsToPeers(Action action, String appName,

String id, InstanceInfo info, InstanceStatus newStatus,

PeerEurekaNode node) {

try {

InstanceInfo infoFromRegistry = null;

CurrentRequestVersion.set(Version.V2);

switch (action) {

case Cancel:

node.cancel(appName, id);

break;

case Heartbeat:

InstanceStatus overriddenStatus = overriddenInstanceStatusMap.get(id);

infoFromRegistry = getInstanceByAppAndId(appName, id, false);

node.heartbeat(appName, id, infoFromRegistry, overriddenStatus, false);

break;

case Register:

node.register(info);

break;

case StatusUpdate:

infoFromRegistry = getInstanceByAppAndId(appName, id, false);

node.statusUpdate(appName, id, newStatus, infoFromRegistry);

break;

case DeleteStatusOverride:

infoFromRegistry = getInstanceByAppAndId(appName, id, false);

node.deleteStatusOverride(appName, id, infoFromRegistry);

break;

}

} catch (Throwable t) {

logger.error("Cannot replicate information to {} for action {}", node.getServiceUrl(), action.name(), t);

}

然后看看調用父類方法注冊：

public void register(InstanceInfo registrant, int leaseDuration, boolean isReplication) {

try {

//register雖然看上去好像是修改，但是這里用的是讀鎖，后面會解釋

read.lock();

//從registry中查看這個app是否存在

Map> gMap = registry.get(registrant.getAppName());

//不存在就創建

if (gMap == null) {

final ConcurrentHashMap> gNewMap = new ConcurrentHashMap>();

gMap = registry.putIfAbsent(registrant.getAppName(), gNewMap);

if (gMap == null) {

gMap = gNewMap;

}

//查看這個app的這個實例是否已存在

Lease existingLease = gMap.get(registrant.getId());

if (existingLease != null && (existingLease.getHolder() != null)) {

//如果已存在，對比時間戳，保留比較新的實例信息......

} else {

// 如果不存在，證明是一個新的實例

//更新自我保護監控變量的值的代碼.....

}

Lease lease = new Lease(registrant, leaseDuration);

if (existingLease != null) {

lease.setServiceUpTimestamp(existingLease.getServiceUpTimestamp());

}

//放入registry

gMap.put(registrant.getId(), lease);

//加入最近修改的記錄隊列

recentlyChangedQueue.add(new RecentlyChangedItem(lease));

//初始化狀態，記錄時間等相關代碼......

//主動讓Response緩存失效

invalidateCache(registrant.getAppName(), registrant.getVIPAddress(), registrant.getSecureVipAddress());

} finally {

read.unlock();

}

總結起來，就是主要三件事：

1.將實例注冊信息放入或者更新registry

2.將實例注冊信息加入最近修改的記錄隊列

3.主動讓Response緩存失效

我們來類比下服務取消

服務取消CANCEL

protected boolean internalCancel(String appName, String id, boolean isReplication) {

try {

//cancel雖然看上去好像是修改，但是這里用的是讀鎖，后面會解釋

read.lock();

//從registry中剔除這個實例

Map> gMap = registry.get(appName);

Lease leaseToCancel = null;

if (gMap != null) {

leaseToCancel = gMap.remove(id);

}

if (leaseToCancel == null) {

logger.warn("DS: Registry: cancel failed because Lease is not registered for: {}/{}", appName, id);

return false;

} else {

//改變狀態，記錄狀態修改時間等相關代碼......

if (instanceInfo != null) {

instanceInfo.setActionType(ActionType.DELETED);

//加入最近修改的記錄隊列

recentlyChangedQueue.add(new RecentlyChangedItem(leaseToCancel));

}

//主動讓Response緩存失效

invalidateCache(appName, vip, svip);

logger.info("Cancelled instance {}/{} (replication={})", appName, id, isReplication);

return true;

}

} finally {

read.unlock();

}

總結起來，也是主要三件事：

1.從registry中剔除這個實例

2.將實例注冊信息加入最近修改的記錄隊列

3.主動讓Response緩存失效

這里我們注意到了這個最近修改隊列，我們來詳細看看

總結

以上是生活随笔為你收集整理的eureka 集群失败的原因_eureka集群中的疑问？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 8数据提供什么掩膜产品_工业轨式1-8路
下一篇： nginx 上传文件漏洞_文件上传及解析